|
|
|
|
|
所属分类: |
计算机及信息技术 |
项目来源: |
其他 |
技术持有方姓名: |
北京大学科技处 |
所在地域: |
其它 |
是否中介: |
否 |
是否重点项目: |
否 |
技术简介: |
项目简介 本词典的研制目的是为中文信息处理建立最基本的语言知识库。根据语法功能和义项相结合的原则收录通用词语51,696;根据语法功能分布的原则,建立面向处理的词类划分体系,实际完成了5万多词语的归类。在此基础上,又对属于同一类的各个词语详细描述了它们的相互区别的语法属性。 本语典对真实文本的覆盖率高。词类体系反映了汉语语法研究的最新成果。5万多词语的归类已是前所未有的语言工程,而总量达250万项语法属性的准确保证了这项语言工程居于国内外领先水平。 主要技术指标 (1)词典收录了51,696词语,对真实文本的覆盖面大。 (2)根据语法功能分布的原则,建立了面向语言信息处理的现代汉语词语分类体系,完成了5万多词语的实际归类。仅此一项工作已是前所未有的语言工程。 (3)在分类的基础上详细描述词语的语法属性。如,对于名词,除了确定每个词的子类外,还详细描述每个名词可以搭配的各类题词及其它属性。动词的属性字段多达128项。从词类住处仅占住处总是的2%可以了解到本词典的属性住处之庞大。 (4)采用关系数据库技术。每一个数据库文件都刻画了属于某一词类的词语与其语法属性的二维关系。目前,词典中共 |
|
|
|
|
设为首页 | 加入收藏 | 广告服务 | 友情链接 | 版权申明
Copyriht 2007 - 2008 © 科普之友 All right reserved |