
汉语虚词知识库的建设
基本介绍
- 书名:汉语虚词知识库的建设
- 出版社:华中师範大学出版社
- 页数:324页
- 开本:32
- 品牌:华中师範大学出版社
- 作者:刘云 邢福义
- 出版日期:2009年5月1日
- 语种:简体中文
- ISBN:7562238855, 9787562238850
内容简介
《汉语虚词知识库的建设》:华中语学论库(第2辑),国家社会科学基金项目成果,霍英东教育基金会青年教师基金项目成果,华中师範大学出版基金全额资助,华中师範大学语言与语言教育研究中心成果。
图书目录
序
前言
第一章 面向信息处理的语言研究
第一节 中文信息处理的发展与成就
一、引言
二、中文信息处理的发展
三、中文信息处理的成就
第二节 汉语自动分析的难点
一、引言
二、词法分析的难点
三、句法分析的难点
四、转换过程的难点
五、小结
第三节 计算机背景下的汉语语法研究
一、研究对象的转换
二、研究目的的转换
三、研究手段的转换
四、研究视角的转换
五、小结
第四节 “句管控”与汉语信息处理
一、引言
二、词语切分与词性标注
三、句法与语义
四、理论与实践
五、小结
第二章 虚词知识库的建设
第一节 虚词与虚词研究
一、虚词概貌及其作用
二、虚词在通用语料库中的使用情况
三、虚词研究
第二节 汉语虚词知识库的重要性
一、词法分析中的作用
二、句法分析中的作用
三、具体套用中的作用
第三节 虚词知识库建设的难点
一、虚词语法意义的概括
二、虚词用法差异的揭示
第四节 虚词知识库的建设
一、引言
二、“三位一体”的虚词知识库建设
三、小结
第三章 虚词词典的内容
第一节 副词机器词典
一、副词及其分类
二、副词栏位的设立
三、副词目录
四、副词机器词典摘录
第二节 连词机器词典
一、连词及其研究
二、连词栏位的设立
三、连词目录
四、连词机器词典摘录
第三节 介词机器词典
一、介词及其分类
二、介词栏位的设立
三、介词目录
四、介词机器词典摘录
第四章 複句层次和关係的自动分析
第一节 複句关係和层次自动分析的目标和意义
一、汉语複句自动分析的目标
二、複句自动分析的意义
第二节 汉语複句自动分析的难点与对策
一、複句自动分析的难点
二、複句自动分析的策略
三、单複句的确认对策
第三节 二重複句自动划分研究
一、引言
二、複句关係词语的包孕机制
三、小结
第四节 複句关係词语离析度
一、引言
二、複句关係词语的离析度
三、複句关係词语离析能力差异分析
第五节 关係词语驱动的複句关係和层次自动
判定
一、引言
二、複句关係词语的作用
三、複句关係词语的表现
四、複句自动分析的流程
第五章 结语
第一节 研究工作回眸
第二节 研究工作构想
附录1 複句层次和关係标注语料库样例及说明
附录2 複句层次和关係自动分析系统
后记
前言
第一章 面向信息处理的语言研究
第一节 中文信息处理的发展与成就
一、引言
二、中文信息处理的发展
三、中文信息处理的成就
第二节 汉语自动分析的难点
一、引言
二、词法分析的难点
三、句法分析的难点
四、转换过程的难点
五、小结
第三节 计算机背景下的汉语语法研究
一、研究对象的转换
二、研究目的的转换
三、研究手段的转换
四、研究视角的转换
五、小结
第四节 “句管控”与汉语信息处理
一、引言
二、词语切分与词性标注
三、句法与语义
四、理论与实践
五、小结
第二章 虚词知识库的建设
第一节 虚词与虚词研究
一、虚词概貌及其作用
二、虚词在通用语料库中的使用情况
三、虚词研究
第二节 汉语虚词知识库的重要性
一、词法分析中的作用
二、句法分析中的作用
三、具体套用中的作用
第三节 虚词知识库建设的难点
一、虚词语法意义的概括
二、虚词用法差异的揭示
第四节 虚词知识库的建设
一、引言
二、“三位一体”的虚词知识库建设
三、小结
第三章 虚词词典的内容
第一节 副词机器词典
一、副词及其分类
二、副词栏位的设立
三、副词目录
四、副词机器词典摘录
第二节 连词机器词典
一、连词及其研究
二、连词栏位的设立
三、连词目录
四、连词机器词典摘录
第三节 介词机器词典
一、介词及其分类
二、介词栏位的设立
三、介词目录
四、介词机器词典摘录
第四章 複句层次和关係的自动分析
第一节 複句关係和层次自动分析的目标和意义
一、汉语複句自动分析的目标
二、複句自动分析的意义
第二节 汉语複句自动分析的难点与对策
一、複句自动分析的难点
二、複句自动分析的策略
三、单複句的确认对策
第三节 二重複句自动划分研究
一、引言
二、複句关係词语的包孕机制
三、小结
第四节 複句关係词语离析度
一、引言
二、複句关係词语的离析度
三、複句关係词语离析能力差异分析
第五节 关係词语驱动的複句关係和层次自动
判定
一、引言
二、複句关係词语的作用
三、複句关係词语的表现
四、複句自动分析的流程
第五章 结语
第一节 研究工作回眸
第二节 研究工作构想
附录1 複句层次和关係标注语料库样例及说明
附录2 複句层次和关係自动分析系统
后记
文摘
1991年,北京语言学院汉语水平考试中心组成研製小组,以国内影响较大的七个动态性频度统计词典、词表和字表为主要依据,编制了《汉语水平辞彙与汉字等级大纲》。其编制总原则为:(1)多学科定量统计与群体性定性分析相结合;(2)语言学科学原财与对外汉语教学需要相结合。共得常用词8822个,分成甲、乙、丙、丁四级,写进《大纲》(修订稿)。这是一次较为典型的把主、客观标準有机结合起来选择汉语常用词的实践。
由于20世纪90年代初期有多个常用字词统计结果的推出,随后常用字词的统计相对沉寂了几年。随着网路等媒体的兴盛,大规模字词统计又开始复兴。进入21世纪后,先后有两次大规模的辞彙统计,分别是《中国语言生活状况报告(2005)》和《中国语言生活状况报告(2006)》。这两次调查统计有三个重要的特点:一是规模大。《中国语言生活状况报告(2005)》调查语料分为平面媒体、有声媒体、网路媒体三种,总计892034个文本档案,909429700字元次,其中汉字出现732143010字次。《中国语言生活状况报告(2006)》调查的语料分为平面媒体、有声媒体、网路媒体三种,总计1311749个文本档案,1170367879字元次,其中汉字出现978994406字次,规模达10亿次,这是迄今为止最大规模的汉语字词统计。二是统计项目全面。两次调查的主要对象是汉字和词语,调查项目有“频次、频率、累加频'率、出现文本数”等。三是成果丰硕。
由于20世纪90年代初期有多个常用字词统计结果的推出,随后常用字词的统计相对沉寂了几年。随着网路等媒体的兴盛,大规模字词统计又开始复兴。进入21世纪后,先后有两次大规模的辞彙统计,分别是《中国语言生活状况报告(2005)》和《中国语言生活状况报告(2006)》。这两次调查统计有三个重要的特点:一是规模大。《中国语言生活状况报告(2005)》调查语料分为平面媒体、有声媒体、网路媒体三种,总计892034个文本档案,909429700字元次,其中汉字出现732143010字次。《中国语言生活状况报告(2006)》调查的语料分为平面媒体、有声媒体、网路媒体三种,总计1311749个文本档案,1170367879字元次,其中汉字出现978994406字次,规模达10亿次,这是迄今为止最大规模的汉语字词统计。二是统计项目全面。两次调查的主要对象是汉字和词语,调查项目有“频次、频率、累加频'率、出现文本数”等。三是成果丰硕。
后记
“汉语虚词知识库的建设”这个课题的研究始自2002年。2002年6月,我在华中师範大学汉语言文字学专业博士毕业,7月进入北京大学计算机科学与技术博士后流动站从事博士后研究。在北京大学博士后研究期间的选题就是“汉语虚词知识库的建设”,博士后期间的研究工作是在导师俞士汶先生的指导下进行的。由于邢福义先生和陆俭明先生的玉成,使我得以在博士研究生在读期间的1999年以访问学者的身份到北京大学计算语言学研究所进修一年。正是这一年的进修,使我得以进人中文信息处理领域。2002年从华中师範大学博士毕业后,随即产生了到计算语言学研究所进行博士后研究的想法。在导师李宇明教授的积极鼓励和俞士汶先生的热情帮助下,我的心愿得以实现,使我又有两年的学习机会。不管是访问学者期间,还是博士后期间,俞士汶老师对我关怀备至,使我对计算语言学研究所有“家”的感觉。博士后期间的研究工作,从选题、论证到研究思路、报告撰写,都融入了俞老师大量的心血。俞老师学识渊博、思维敏捷、治学严谨,对学生要求严格、精益求精,在这个浮躁的社会依然保持着一个学者的内敛和谦谨;言传身教,不仅给了我学业上耐心细緻的指导,而且给了我深刻的人生启迪,使我受益匪浅。师母朱学锋老师慈祥和蔼,给了我太多的帮助。
序言
随着历史的发展,社会的进步,科技的发达,语言学在整个世界範围内越来越展示出强大的活力和能量。中国语言学是世界语言学的重要组成部分。为了对中国语言学事业有所推动,我们组织撰写“华中语学论库”。作为专用名称,这里的“语学”主要指汉语语言学,近期的15年时间里以现代汉语语法专题研究为重点。“语学论库”,这是汉语语言学研究的一个系统工程,如果将来主客观条件具备,在研究範围上可以不断扩大,在研究时间上可以无限延展,在研究队伍上可以辈辈交接,代代传承。“华中”一词,既跟研究队伍的华中群体相关,又跟华中师範大学出版社的名称相关。
汉语语言学源远流长。千百年来,特别是《马氏文通》出版以来,尤其是20世纪70年代之后,由于一代代学者的不懈努力,汉语语言学沿着“创业——拓新——发展”的轨道不断推进。目前,汉语语言学所统括的汉语语法学、汉语语音学、汉语方言学、汉语辞彙学、汉语语用学等等学科,都已出现了初步繁荣的喜人局面。
汉语语言学源远流长。千百年来,特别是《马氏文通》出版以来,尤其是20世纪70年代之后,由于一代代学者的不懈努力,汉语语言学沿着“创业——拓新——发展”的轨道不断推进。目前,汉语语言学所统括的汉语语法学、汉语语音学、汉语方言学、汉语辞彙学、汉语语用学等等学科,都已出现了初步繁荣的喜人局面。
转载请注明出处累积网 » 汉语虚词知识库的建设