精彩专题推荐:建站之入门课 建站之必修课 建站之关键课 网站价值所在 流量提高专题 css+div 标准 个人网站打造全过程
  • 让你的网站产生收益赚钱,有博客和网站的绝对不能错过
  • 将指定的流量带到你的网站,为你站增加有效的访客,为你提升业绩
  • .NET开发 正则表达式中的 Bug

    来源:不详 时间:07-10-23 点击: 点击这里收藏本文

      又发现了一个 .net 的 bug!最近在使用正则表达式的时候发现:在忽略大小写的时候,匹配值从 0xff 到 0xffff 之间的所有字符,正则表达式竟然也能匹配两个 ASCII 字符:i(code: 0x69) 和 I(code: 0x49);但是仍然不能匹配其他的 ASCII 字母和数字。

      比如以下的代码就是用来测试用正则表达式匹配从 0xff 到 0xffff 的字符。而值范围在 0 到 0xfe 的所有字符是不能被匹配的。

      1234567891011121314151617Regex regex = new Regex(@"[\u00FF-\uFFFF]+");
      // The characters, whoes value are smaller than 0xff, are not expected to be matched.
      for (int i = 0; i < 0xff; i++) {
      string s = new string(new char[] { (char)i });
      Debug.Assert(
      !regex.IsMatch(s),
      string.Format("The character was not expected to be matched: 0x{0:X}!", i));
      }
      // However, the characters whoes value are greater than 0xfe are expected to be matched.
      for (int i = 0xff; i <= 0xffff; i++) {
      string s = new string(new char[] { (char)i });
      Debug.Assert(
      regex.IsMatch(s),
      string.Format("The character was expected to be matched: 0x{0:X}!", i));
      }

      这时的运行结果是正常的,没有任何的断言错误出现。

      然而当使用忽略大小写的匹配模式时,结果就不一样了。将上面代码中的第一行改成:

      1Regex regex = new Regex(@"[\u00FF-\uFFFF]+", RegexOptions.IgnoreCase);

      程序运行的时候就会有两处断言错误。它们分别是字符值为 73 和 105,也就是小写字母 i 和大写字母 I。 这个 bug 非常奇怪,别的字符都很正常!而且用 javascript 脚本在 IE (版本是6.0)里面运行也同样有这么 bug 存在(比如下面这段代码)。然而在 Firefox 中运行就是没有问题的。还是 Firefox 好啊,呵呵!

      1234567891011121314151617var re = /[\u00FF-\uFFFF]+/;
      // var re = /[\u00FF-\uFFFF]+/i;
      for(var i=0; i<0xff; i++) {
      var s = String.fromCharCode( i );
      if ( re.test(s) ){
      alert( 'Should not be matched: ' + i + '!' );
      }
      }
      for(var i=0xff; i<=0xffff; i++) {
      var s = String.fromCharCode( i );
      if ( !re.test(s) ){
      alert( 'Should be matched: ' + i + '!' );
      }
      }


    用户评论

    广而告之