最新文章 (全部类别)
安装DevExpress V22.1.13
官方VS2022下载,VS2022密钥
C/S快速开发框架旗舰版CSFrameworkV6.0 - VS开发环境配置
运行.NET8 Winform程序弹窗用户账户控制解决方案
使用Xlight FTP文件服务器
CSFramework试用版定制用户软件信息
DevExpress TreeList树形表格组件使用
DevExpress GridView表格不启用/禁用主从表模式(Master/Detail)
CSFrameworkV6开发框架集成GZUpdate.Client自动升级程序
FastReport.NET2023破解版去除水印DEMO VERSION (2023.1.8/2023.2.18版本)
.NET8调用存储过程传入DataTable表类型解决方案
使用DeepSeek生成DevExpress表格、窗体、C#模型代码并集成到开发框架
C# EF+LINQ 查询主表明细表数据查询条件写法
C/S架构软件开发平台 - 旗舰版V6.1 - 序列号管理
塑木地板行业ERP - 用户操作手册 - 物料类别管理
QMS五金制品行业报价系统 - 用户操作手册 - 成本基础资料表
QMS五金制品行业报价系统 - 用户操作手册 - 采购评估
QMS五金制品行业报价系统 - 用户操作手册 - 设备登记
QMS五金制品行业报价系统 - 用户操作手册 - 新品可行性评估
QMS五金制品行业报价系统 - 用户操作手册 - 工艺工序维护
QMS五金制品行业报价系统 - 用户操作手册 - 业务员管理
QMS五金制品行业报价系统 - 用户操作手册 - 客户管理
塑木地板行业ERP - 用户操作手册 - 组织架构(部门)
塑木地板行业ERP - 用户操作手册 - 系统初始化
塑木地板行业ERP - 用户操作手册 - 付款AP
塑木地板行业ERP - 用户操作手册 - 供应商对账单
塑木地板行业ERP - 用户操作手册 - 收款AR
塑木地板行业ERP - 用户操作手册 - 客户对账
塑木地板行业ERP - 用户操作手册 - 销售退货
塑木地板行业ERP - 用户操作手册 - 采购入库
塑木地板行业ERP - 用户操作手册 - 采购退货
塑木地板行业ERP - 用户操作手册 - 采购订单
塑木地板行业ERP - 用户操作手册 - 供应商管理
CSFrameworkV6.0 - 快速开发平台 - 增加字段操作步骤
录入基础资料数据,编码自动生成,自动编号
塑木地板行业ERP - 用户操作手册 - 客户送货单(成品出库)
塑木地板行业ERP - 用户操作手册 - 客户管理
VS2022项目自动刷新依赖项程序集引用(出现黄色叹号)
.NETCore WebApi服务器提供本地文件服务(通过URL访问图片)
C/S架构软件开发平台 - 旗舰版V6.0 - 底层框架迭代开发
.NET8 Winform桌面应用程序禁用dpi缩放
GIT改了密码导致无法提交代码解决方案
OneDrive安装闪退解决方案
VS2022正在加载设计器,连接到已命名的管道时发生超时
客户端部署.NET7程序 | 客户端安装环境
DevExpress.XtraTreeList.TreeList 组件自动定位当前记录
塑木地板行业ERP - 用户操作手册 - 软件安装&部署
塑木地板行业ERP - 用户操作手册 - 用户管理
塑木地板行业ERP - 用户操作手册 - 角色管理
塑木地板行业ERP - 用户操作手册 - 成品出入库历史记录
.net敏捷开发,创造卓越

模拟百度搜索渲染HTML页面关键词高亮分组排序算法(C#)


  模拟百度搜索渲染HTML页面关键词高亮分组排序算法(C#)
模拟百度搜索渲染HTML页面关键词高亮分组排序算法(C#)

最近在研究模拟百度搜索以及自动中文分词算法,从数据库查询到相关关键词结果,最后是渲染HTML页面的关键词,关键词部分采用黄色背景红色字体高亮显示。

最后在渲染HTML页面的关键词高亮环节出现小问题,没有正确渲染关键词,如下图:

贴图图片-模拟百度搜索渲染HTML关键词高亮排序算法1


高亮关键词失败原因:

关键词高亮是根据自动分词系统分解的关键词顺序进行的,比如上图的关键词分词结果:api,webapi,程序首先高亮渲染api关键词,那么webapi关键词被强行拆分了!!!

HTML Code:

web<span class="search-highlight">api</span>


当程序高亮webapi关键词的时候,HTML内容已经无法匹配到webapi关键词!


解决方案:对关键词的包含关系重新分组排序!!!

逻辑推理:首先高亮webapi关键词,然后高亮api

HTML Code:

<span class="search-highlight">webapi</span>

//来源:C/S框架网(www.csframework.com) QQ:23404761




贴图图片-模拟百度搜索渲染HTML关键词高亮排序算法2



渲染HTML页面关键词高亮分组排序算法:


C# Code:

/// <summary>
/// 渲染HTML页面关键词高亮分组排序算法
/// </summary>
public class KeywordSort
{
  
  
/// <summary>
  
/// 关键词分组排序算法
  
/// </summary>
  
/// <param name="keyWords"></param>
  
/// <returns></returns>
  
public static string SortKeywords(string keyWords)
  {
    
try
    {
      
#region 按每个关键词包含关系分组
      
      SortedList groups
= new SortedList();
      
string[] keys = keyWords.Split(',');
      
foreach (string key in keys)
      {
        
if (String.IsNullOrEmpty(key)) continue;
        
        ArrayList sort
= new ArrayList();
        
foreach (string s in keys)
        {
          
if (s.IndexOf(key) >= 0) sort.Add(s);
        }
        
if (sort.Count > 1) sort.Sort(new SortComapre());//按包含关系排序
        
groups.Add(key, sort);
      }
      
      
#endregion
      
      
#region 重新组合关键词 - 按关键词分组关系重新组合
      
      ArrayList result
= new ArrayList();
      
      
foreach (DictionaryEntry g in groups)
      {
        
foreach (string s in (g.Value as ArrayList))
        {
          
if (!result.Contains(s)) result.Add(s);
        }
      }
      
      
#endregion
      
      
//输出关键词组合,逗号分开
      
StringBuilder sb = new StringBuilder();
      
foreach (string s in result) sb.Append(s + ",");
      
      
return sb.ToString();
    }
    
catch (Exception ex)
    {
      
return keyWords;
    }
  }
  
}


//来源:C/S框架网(www.csframework.com) QQ:23404761



C# Code:

/// <summary>
/// 排序比较。被包含的词置后。比如:api,webapi 输出==> webapi,api, api被包含,排序放后面
/// </summary>
public class SortComapre : IComparer
{
  
public int Compare(object x, object y)
  {
    
if (x == null && y == null) return 0;
    
if (x == null && y != null) return -1;
    
if (x != null && y == null) return 1;
    
    x
= x.ToString().ToLower();
    y
= y.ToString().ToLower();
    
    
if (x.ToString() == y.ToString())
    
return 0;
    
else if (x.ToString().Contains(y.ToString()))
    
return -1;
    
else if (y.ToString().Contains(x.ToString()))
    
return 1;
    
else
    
return 0;
  }
  
}


//来源:C/S框架网(www.csframework.com) QQ:23404761



参考文章:


模拟搜索引擎中文自动分词算法精华(CSFramework特别提供C#源码)


C#模拟百度搜索长词自动语义匹配,使用分词算法抽取关键词


C#使用分词算法从文本字符串中抽取关键词模拟百度搜索






扫一扫加微信:
 

版权声明:本文为开发框架文库发布内容,转载请附上原文出处连接
C/S框架网
上一篇:C#使用StreamWriter在大文本文件末尾添加一行内容
下一篇:C# OleDbConnection读取加装Excel2003(.xls),Excel2007(.xlsx)文件
评论列表

发表评论

评论内容
昵称:
关联文章

模拟搜索渲染HTML页面关键词分组排序算法(C#)
C#模拟搜索长词自动语义匹配,使用分词算法抽取关键词
C#使用分词算法从文本字符串中抽取关键词模拟搜索|CSFramework.COM巨献
CSFramework模拟搜索引擎自动语义分析分词算法(C#)
官网搜索引擎SEO,关键词SEO,搜索分词系统一体化解决方案
原创:CodeHighlighter源代码格式化,代码缩进,关键词着色(C#源码)
C# CodeHighlighter生成的着色HTML源码格式化
搜索资源平台蜘蛛抓取频次为零怎么办?
Winform开发平台搜索结果
C#推送URL链接到搜索资源平台快速收录URL网址
关键词排名查询工具-喜鹊软件-SeoRank
热烈祝贺C/S框架网搜索关键字排名第一
模拟搜索引擎中文自动分词算法精华(CSFramework特别提供C#源码)
C#推送链接URL到搜索资源平台提高收录量
如何获取被收录的关键词
CMS代码 - Prism下载
C#.NET地图定位API解决方案
C#源代码着色类(C/S框架网开源)
C# 格式化CodeHighlighter生成的SQL脚本着色源码(CSFramework.com原创)
地图API应用 - 根据地址查询经纬度

热门标签
软件著作权登记证书 .NET .NET Reactor .NET5 .NET6 .NET7 .NET8 .NET9 .NETFramework AI编程 APP AspNetCore AuthV3 Auth-软件授权注册系统 Axios B/S B/S开发框架 B/S框架 BSFramework Bug Bug记录 C#加密解密 C#源码 C/S CHATGPT CMS系统 CodeGenerator CSFramework.DB CSFramework.EF CSFramework.License CSFrameworkV1学习版 CSFrameworkV2标准版 CSFrameworkV3高级版 CSFrameworkV4企业版 CSFrameworkV5旗舰版 CSFrameworkV6.0 CSFrameworkV6.1 CSFrameworkV6旗舰版 DAL数据访问层 Database datalock DbFramework DeepSeek Demo教学 Demo实例 Demo下载 DevExpress教程 Docker Desktop DOM ECS服务器 EFCore EF框架 Element-UI EntityFramework ERP ES6 Excel FastReport GIT HR IDatabase IIS JavaScript LINQ MES MiniFramework MIS MySql NavBarControl NETCore Node.JS NPM OMS Oracle资料 ORM PaaS POS Promise API PSD QMS RedGet Redis RSA SAP Schema SEO SEO文章 SQL SQLConnector SQLite SqlServer Swagger TMS系统 Token令牌 VS2022 VSCode VS升级 VUE WCF WebApi WebApi NETCore WebApi框架 WEB开发框架 Windows服务 Winform 开发框架 Winform 开发平台 WinFramework Workflow工作流 Workflow流程引擎 XtraReport 安装环境 版本区别 报表 备份还原 踩坑日记 操作手册 达梦数据库 代码生成器 迭代开发记录 功能介绍 官方软件下载 国际化 基础资料窗体 架构设计 角色权限 开发sce 开发工具 开发技巧 开发教程 开发框架 开发平台 开发指南 客户案例 快速搭站系统 快速开发平台 框架升级 毛衫行业ERP 秘钥 密钥 权限设计 软件报价 软件测试报告 软件加壳 软件简介 软件开发框架 软件开发平台 软件开发文档 软件授权 软件授权注册系统 软件体系架构 软件下载 软件著作权登记证书 软著证书 三层架构 设计模式 生成代码 实用小技巧 视频下载 收钱音箱 数据锁 数据同步 塑木地板行业ERP 微信小程序 未解决问题 文档下载 喜鹊ERP 喜鹊软件 系统对接 详细设计说明书 新功能 信创 行政区域数据库 需求分析 疑难杂症 蝇量级框架 蝇量框架 用户管理 用户开发手册 用户控件 在线支付 纸箱ERP 智能语音收款机 自定义窗体 自定义组件 自动升级程序
联系我们
联系电话:13923396219(微信同号)
电子邮箱:23404761@qq.com
站长微信二维码
微信二维码