雑記 - otherwise

最近はDQ10しかやっていないダメ技術者がちまちまと綴る雑記帳

正規表現

アンカー要素から URI と CONTENT を取り出す正規表現

ネタ元は ch3cooh さんのところ。 コメントに書いたものは、 2004 年に書いたコードでした。 XML コメントも使ってないし。。。 まぁ、それはいいとして、一応、正規表現部分だけ展開しておきます。 <a\s+(?<!href=).*href="?(?<URI>[\w:!#$%=&\-^`\\|@~\[{\]};+*,.?/]+)"?(?:\s+(?]*)?\s*>(?<CONTENT></content></a\s+(?<!href=).*href="?(?<uri>…

「 0 文字以上の任意の文字」は何にマッチする?

久々に正規表現の話が出来る♪ 正規表現における空文字は特別扱いだ。 (The road to C# master trapemiya) とても面白い考察ですが、残念ながら違います。 実のところ、この辺の処理仕様は、詳説 正規表現を読むと判る話なんですが、さすがに NFA エンジンの…

文字列の先頭にある数字にマッチする正規表現

また終了した検索へのチャチャ入れ。 question:1120987491 で提示された正規表現だと、確かに「文字列の先頭にある数字の連続」にはマッチするけど、「 00012 」(数字文字列)にもマッチしてしまうし、「 123.45 」(小数)にはマッチしないですね。 まぁ、…

正規表現で良くやるミス

question:1107762500 の件。 文字クラス ("[ ]") を使う場合、 "-" は先頭に置くのが基本。(エスケープでもいいとは思うけど、後で読みにくくなる気がする) ……だけど、良く忘れるんですよね。(私もたまにやる……そしていつも悩む)ちなみに、今回の場合は…