久久免费精品一区二区,一本色道久久88加勒比—综合,亚洲综合日韩久久成人AV

如何使用正則表達式匹配非[url]標簽之外的@用戶名？

如何僅匹配非[url]標簽內的@用戶名？

本文探討如何從包含多種用戶名標記的文本中，提取僅位于[url]標簽之外的@用戶名。文本示例如下：

[url=/space/4]@張三[/url] [url=/space/5]@李 四[/url] @張三 @張三 [url=/space/6]@王五[/url] [url=/space/7]@趙六[/url] [url=/space/8]@wolegequ[/url]@sweet @haha

目標是提取@張三, @sweet, @haha。題目要求避免使用正則表達式的斷言（lookahead/lookbehind）。

直接使用正則表達式一次性精準匹配所有目標用戶名非常困難，甚至不可能在不使用斷言的情況下完成。因此，我們需要一個兩步走的策略：

第一步：匹配所有@用戶名

我們可以使用以下簡單的正則表達式匹配所有以@開頭，后跟一個或多個非@字符的字符串：

@([^s@]+)

這個表達式會匹配到所有@用戶名，包括在[url]標簽內的。

第二步：過濾掉[url]標簽內的用戶名

在第一步匹配到的結果基礎上，我們需要編寫代碼來過濾掉位于[url]標簽內的用戶名。這可以通過字符串操作來實現。例如，我們可以遍歷第一步匹配到的用戶名列表，對于每個用戶名，檢查其是否位于[url]標簽內。如果位于[url]標簽內，則將其從列表中移除。

示例代碼 (python):

import re  text = "[url=/space/4]@張三[/url] [url=/space/5]@李 四[/url] @張三 @張三 [url=/space/6]@王五[/url] [url=/space/7]@趙六[/url] [url=/space/8]@wolegequ[/url]@sweet @haha"  # 第一步：匹配所有@用戶名 usernames = re.findall(r"@([^s@]+)", text)  # 第二步：過濾掉[url]標簽內的用戶名 filtered_usernames = [] for username in usernames:     start_index = text.find("@" + username)     end_index = start_index + len("@" + username)     before = text[:start_index]     after = text[end_index:]     if not (before.rfind("[url]") > before.rfind("[/url]") and start_index > before.rfind("[url]") and end_index < len(text) and text[end_index:].find("[/url]") > 0):       filtered_usernames.append("@" + username)   print(filtered_usernames)  # 輸出: ['@張三', '@張三', '@張三', '@sweet', '@haha']

這段代碼首先使用正則表達式匹配所有@用戶名，然后遍歷匹配結果，通過檢查[url]標簽的位置來判斷用戶名是否在標簽內。只有不在[url]標簽內的用戶名才會被添加到filtered_usernames列表中。

這種方法雖然比使用斷言的正則表達式更復雜，但它滿足了題目不使用斷言的要求，并有效地提取了目標用戶名。需要注意的是，此代碼假設[url]標簽是正確的，并且成對出現。對于更復雜的場景，可能需要更健壯的字符串解析方法。

文章版權歸作者所有，未經允許請勿轉載。

THE END