欢迎来到代码驿站!

.NET代码

当前位置:首页 > 软件编程 > .NET代码

C#敏感词过滤实现方法

时间:2021-06-28 08:24:33|栏目:.NET代码|点击:

本文实例讲述了C#敏感词过滤实现方法。分享给大家供大家参考。具体如下:

这两天突然想到了敏感词过滤 就结合网上找到的资料自己写了一个,脏字数量700+(效率不是很高 测试在110多KB的情况下比replace快 3-4倍)
测试结果图 单位:秒

代码如下:

System.Text.StringBuilder sb = new System.Text.StringBuilder(text.Length);
 string filterText = "需要过滤的脏字 以|分开";
 //脏字 可根据自己的方式用分隔符
 string[] filterData = filterText.Split('|');
 foreach (var item in filterData)
 {
  char value = item[0];
  if (dicList.ContainsKey(value))
   dicList[value].Add(item);
  else
   dicList.Add(value, new List<string>() { item });
 }
 int count = text.Length;
 for (int i = 0; i < count; i++)
 {
  char word = text[i];
  if (dicList.ContainsKey(word))//如果在字典表中存在这个key
  {
   int num = 0;//是否找到匹配的关键字 1找到0未找到
   var data = dicList[word].OrderBy(g => g.Length);
   //把该key的字典集合按 字符数排序(方便下面从少往多截取字符串查找)
   foreach (var wordbook in data)
   {
    if (i + wordbook.Length <= count)
    //如果需截取的字符串的索引小于总长度 则执行截取
    {
     string result = text.Substring(i, wordbook.Length);
     //根据关键字长度往后截取相同的字符数进行比较
     if (result == wordbook)
     {
      num = 1;
      sb.Append(GetString(result));
      i = i + wordbook.Length - 1;
      //比较成功 同时改变i的索引
      break;
     }
    }
   }
   if (num == 0)
    sb.Append(word);
  }
  else
   sb.Append(word);
 }
 return sb.ToString();
}
/// <summary>
/// 替换星号
/// </summary>
/// <param name="value"></param>
/// <returns></returns>
private static string GetString(string value)
{
 string starNum = string.Empty;
 for (int i = 0; i < value.Length; i++)
 {
  starNum += "*";
 }
 return starNum;
}

还有待优化的地方

各位有更好的方法还请分享指点一下,说明原理

希望本文所述对大家的C#程序设计有所帮助。

上一篇:C#使用非托管代码直接修改字符串的方法

栏    目:.NET代码

下一篇:VSCode配置C#运行环境的完整步骤

本文标题:C#敏感词过滤实现方法

本文地址:http://www.codeinn.net/misctech/149260.html

推荐教程

广告投放 | 联系我们 | 版权申明

重要申明:本站所有的文章、图片、评论等,均由网友发表或上传并维护或收集自网络,属个人行为,与本站立场无关。

如果侵犯了您的权利,请与我们联系,我们将在24小时内进行处理、任何非本站因素导致的法律后果,本站均不负任何责任。

联系QQ:914707363 | 邮箱:codeinn#126.com(#换成@)

Copyright © 2020 代码驿站 版权所有