绑定机构
扫描成功 请在APP上操作
打开万方数据APP,点击右上角"扫一扫",扫描二维码即可将您登录的个人账号与机构账号绑定,绑定后您可在APP上享有机构权限,如需更换机构账号,可到个人中心解绑。
欢迎的朋友
万方知识发现服务平台
获取范围
  • 1 / 1
  (已选择0条) 清除
找到 4 条结果
[成果] hg08030474 北京
TP3 应用技术 数据处理 公布年份:2008
成果简介:中文信息处理毋庸置疑地要使用汉语的语法性质。但是,长期以来,中文信息处理界所使用的汉语的语法体系基本上是面向英语的,面向人的,面向结构分析的。本课题为了提高汉语处理应用软件的性能,打破这一传统,彻底反思汉语处理的语言学基础,研究适合于汉语的、适合于计算机处理的、适合于词语线形关系的文法,创新性地提出了线形文法的思路,并有多方面的原创性成果,包括:提出了简单短语概念并拟订了界定规范并设计了相应的识别方法;提出了基于线性邻接分布特征的词语相似性计算方法,有效的缓解了统计的数据稀疏问题;提出了基于可信度的人名识别方法和多特征集成的新词语识别方法。理论成果应用到了计算机辅助校对系统、字音转换系统中。研究过程中开发和完善了一批高性能汉语处理软件,包括通用汉语分词系统GPWS和面向语言教学研究的汉语语料库检索系统CCRL,整理加工了九亿多字的大规模现代汉语语料库。软件系统和相关技术为新浪网、哈佛、北大、清华等海内外多家单位和个人使用。本课题发表论文20余篇,申报国家发明专利1项,获2005年教育部科技进步奖。
[成果] 0501230074 北京
[TP3, H19] 应用技术 [公共软件服务, 社会人文科学研究与试验发展] 公布年份:2004
成果简介:北京语言大学在国家863计划、国家自然科学基金和教育部项目的支持下,研制成功了面向语言教学研究的汉语语料检索软件系统CCRL。该软件可对汉语文本进行检索,检索目标包括字串、词串、词属性串及词与词属性的混合串。使用该软件无需人工标注就能基于任何词表、任何词属性体系和词属性标注,对任何生语料全自动地生成索引并进行检索,能在较高准确率的基础上保证查全率,声称索引和进行检索的速度很快,从而能在极大程度上提高检索效率,使语言教学和语言研究工作者不仅能摆脱收集语言实例卡片的繁重劳动,而且使过去不可能实现、甚至不可能想象的大规模语言现象调查工作成为可能,从而能大大提高语言研究水平,促进语言教学(特别是对外汉语教学)和语言信息处理的发展。 CCRL还有多项辅助功能。如能自动发现新词语,并有方便的人机界面确认新词语并确定其属性;可以根据汉语拼音、笔画对检索结果的上下文自动排序;能提供检索出的实例的出处信息;能自动提供任意文本的字频、词频的统计和排序信息,包括未登录词的信息;检索结果和统计结果既可以按文本方式提供,也可以按数据库方式提供。CCRL的创新技术有:高速准确的自动分词算法,索引与用户词库自动关联的方法,动态识别的专名与用户词表中词语统一编码的方法,将词形、词属性、词出现位置、词出现上下文的出处以压缩方式进行编码的方法,高效的文本字串(词串)按上下文排序的算法等。CCRL软件系统已经对8亿多字的各种文体的汉语文本语料库建立了字索引和多种词语属性索引,词语属性包括语法、语义、语音、构词等方面,并已取得多项有意义的研究成果。CCRL网络测试版已在北京语言大学语言信息处理研究所网站(http://clip.blcu.edu.cn)发布,全球的用户都可自由使用。 2004年1月13日,教育部在北京语言大学组织和主持了CCRL检索系统的技术鉴定。鉴定委员会一致认为该系统设计思想新颖、检索效率高,已得到成功试用,达到了该领域国际领先水平。 CCRL的推广对象为国内外大学中文系、语言学系,语言研究所,从事汉语词典编纂业务的出版社,从事中文信息处理的研究开发单位。
[成果] gkls008493
G85 应用技术 公布年份:2002
成果简介:我国目前须深入研究无数太极拳的内在哲理,并适当向外国留学生讲授,使其跟上国内武术太极拳研究的最新进展,继承和发展传统武术太极拳理论,引起外国留学生对武术太极拳理论,引起外国留学生对无数太极拳内涵的思考。
[成果] hg06075524 北京
H08 应用技术 社会人文科学研究与试验发展 公布年份:2001
成果简介:该研究技术原理为歧义切分对5段和5段以下的歧义字段进行了穷尽式的分析处理,对于5段以上的歧义字段提出了高准确度的一般性规则,实现了专名识别和排歧的一体化算法。性能指标:分词准确率(分词正确的字数/全文字数)>98%;分词速度(P3机器)>50万字/秒;上层应用系统可以借助方便的接口函数得到分词系统的支持,同时享有充分的自主性。在分词中使用规则与程序相分离的软件方法;实现了歧义字段切分的一般性规则;区分分词系统底库和上层应用词库;引入了词条标识码的概念;使分词结果结构化,将分词结果从刚性的板块序列改成柔性的结构序列;实现了基于结构化分词结果的分词评测系统。
  (已选择0条) 清除
公   告

北京万方数据股份有限公司在天猫、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!查看详情

手机版

万方数据知识服务平台 扫码关注微信公众号

学术圈
实名学术社交
订阅
收藏
快速查看收藏过的文献
客服
服务
回到
顶部