核心业务
首页 > 网络技术

中文分词处理系统

中文分词处理系统

作为专业的中文分词技术提供商,专注基础研发,不断打破查准率的极限。中文分词是自然语言处理领域的基础。猎兔中文分词主要是针对中文文本进行带词性标注的分词系统,他不仅对文本中的普通词进行分词切分,还包括对未登录词的切分;猎兔还有针对对各行业的大量分词的词库,可以满足多个行业的分词需求;猎兔中文分词系统的高分词准确率,召回率,F-score在领域内都是值得赞赏的。

产品功能

  • 猎兔可定制的系列中文分词模块包括java版本,.net(c#)版本和C++版本的API,同时提供分行业的词库,可满足多行业,多种平台应用的需要。
  • 猎兔分词产片的分词速度可以达到6000字每秒,正确率能达到98%以上。产品支持UTF-8,GBK,BIG5,UNICODE等多种编码。

运行环境

  • 操作系统:Linux,Windows,Solari,AIX,HPUX等各种平台
  • 数据库:SQLServer,Oracle
  • 应用服务器:Tomcat,WebSphere,Weblogic
  • 客户端:Windows IE6.0/7.0/8.0

产品特色

  • 猎兔中文分词有未登录词的识别功能,其中包括:中国人名,外国人名,地点名,组织机构名,并且识别的效果很好。
  • 猎兔综合运用了n元语法模型,隐马尔科夫模型,规则识别等方法,识别效率高。
  • 同时支持分词和词性标注,可以提供丰富的语法语义信息。
  • 提供参数调节分词准确性和切分速度。
  • 采用多个大规模语料库训练概率词库,保证了分词正确率的领域无关性。
  • 100%采用java实现的分词组件,无内存泄漏问题,可长期不间断使用。
  • 提供多种分词的接口(如:返回普通字符串数组,返回CnToken数组形式等),灵活易用。

应用领域

猎兔中文分词可以广泛应用于多项自然语言基础工作处理工作,包括拼写检查与纠错,文档排重,情感分析,文本分类,自动文摘,机器翻译,问答系统,文本检索等等。

我们在全球的每个城市都在诚招城市合作伙伴,
如果您已成为我们的城市合伙人,请点击这里获取更多营销资料,
点击这里进入城市合伙人专区进行项目报备、订单管理、获取技术支持等操作。

联系我们

北京市海淀区翠微路2号院
中国印刷科学技术研究所科贸楼

010-68317559
13661216061

50805044@qq.com

CopyRight © 2006- 北京盈瑞达电子技术有限公司      京公网安备 11010802039701号    京ICP备2022019203号