ImageVerifierCode 换一换
格式:PDF , 页数:3 ,大小:122.59KB ,
资源ID:741350      下载积分:7 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付 微信扫码支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.ketangku.com/wenku/file-741350-down.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(计算语言学隐藏在北语的一座金矿.pdf)为本站会员(a****)主动上传,免费在线备课命题出卷组卷网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知免费在线备课命题出卷组卷网(发送邮件至kefu@ketangku.com或直接QQ联系客服),我们立即给予删除!

计算语言学隐藏在北语的一座金矿.pdf

1、计算语言学,隐藏在北语的一座金矿地处“宇宙中心”北京五道口,与清华相邻不远,人称“小联合国”的北京语言大学有两个王牌专业。一个是名满天下的汉语国际教育(俗称对外汉语教学),还有一个专业知道的人不多,因为它是北语这所文科为主的学校里唯一一个理工专业,该专业学术大拿云集,某些研究领域甚至位列世界前列,它就是隐藏在北语的一座金矿语言智能与技术(俗称计算语言学)。计算语言学到底研究啥北语的计算语言学开设于全校唯一理工科学院信息科学学院(简称信科)。北语信科的历史有三十二年了,前身是计算机科学与技术系,成立于 2000 年,再之前,是 1987 年成立的中国第一个以汉语信息处理为主要研究方向的“语言信息

2、处理研究所”。2014 年,北语进行了大部制改革,信科在原有的语言信息处理研究所基础上,成立了另外三个研究所,分别是:大数据与语言教学研究所、语言监测与社会计算研究所(国家语言监测与研究平面媒体中心)和管理科学与工程研究所。几个研究所基本上都与计算语言学学科直接相关,分别对语言的教学、研究和应用开展深入的研究。信科的主要任务是培养外语水平出色,具有信息处理基本素养的通用人才,在信息領域开展一些前沿性的研究。计算语言学就是利用计算机对语言进行计算处理,比如要提出某个语言现象,若没有语言数据的支持,就不能成为一个语言规律。而发现规律一般有两种方法:一种基于规则,如语法专家经过研究,发现语言规律;另

3、一种基于统计,根据大规模数据提炼规则。后一种就是计算语言学主要做的事。在这门融合了计算机科学、语言学和数学的计算语言学中,计算机科学是研究工具,语言学是处理对象,数学是建模工具,此外还会用到物理学等知识。计算语言学,是从字、词、句、篇章、语音等各个维度去研究语言,比如让计算机自动评判一个留学生写汉字写得对不对、好不好,这项技术的核心是数学曲线在二维平面的变换;再比如研究日本人说汉语,计算机可以判断他们说得对不对、准不准,这项技术就利用了物理学中的声学理论,通过发音的波形进行判断。计算语言学的应用还有很多,最常见的比如在拼音输入法中,有一项功能是“拼写和语法错误”,一旦判定有错误嫌疑,系统就会用

4、红色波浪线划出。还有让计算机评判一篇论文写得好不好,对不对等。资源优势独一无二除了北语,国内开展计算语言研究的还有清华大学、北京大学、中国科技大学、哈尔滨工业大学、复旦大学等名校。每所大学的研究各有侧重,比如中国科技大学的科大讯飞主攻语音信息处理,特别是语音识别。语音识别的应用也很多,比如语音输入法,又比如语音考试,在口语考试中,有一种题型是模仿原声读句子,计算机会给考生自动评分。传统牛校的计算语言研究规模大,相比之下,北语更像是小团队作战,但在某些领域有得天独厚的优势。这优势就是在语言资源方面,尤其是搜集外国人的语言资源上面。比如需要收集各国人书写的汉字样本做研究,在北语,随便推开一间教室的

5、门,20 位同学就可能来自 20 个国家,只要收集每个人的汉字,就是 20 个国别样本。目前,约有 170 多个国家和地区的学生在北语学习,校园里能见到世界各地的人。在北语,研究语言信息处理根本不愁样本,这是其他高校无法比拟的。此外,计算语言研究需要的理论知识,北语也有着得天独厚的条件。在培养汉语国际教学师资方面,北语是培训汉语国际教学师资的官方机构,对汉语国际教学中的各种教学研究得非常深入。丰富的学生资源、专业的理论积累,都为北语的计算语言学提供了良好环境。专业教学各有特色北语计算语言学专业招收本科、硕士和博士。本科时要将基础数学、物理、统计等基础学科学扎实了,这可不简单。在本科生眼里,高等

6、数学、线性代数、离散数学和概率论与数理统计是“四座大山”。在计算语言学专业中,数学是基础,所有的语言现象都要对应一个语言模型。什么是语言模型?说得简单点儿就是一个数学公式。攻克了“四座大山”,大三大四的学生就可以选人工智能、自然语言处理等选修课了,还可以参与到学院老师们的研究项目中。本科生直接申请项目或直接参与科学研究,这是北语信科的特色。至于硕士和博士,北语的计算语言学专业文理兼收,会针对每个人的专业特长、兴趣点对他们的研究方向进行专门定制。多数硕士博士是理工科出身,他们会编程,但一般不懂语言学,进来后要补修语言学概论等语言学基础课程。文科背景的研究生则要补数学和计算机课程,但这没有想象中那

7、么痛苦,甚至有几位文科研究生经过一段时间的学习,成了编程大拿。北语计算语言学强调动手能力,本科生、硕士生和博士生有时会参加同一个研究课题,但是对他们的要求是不同的:本科生做的是基础工作;研究生则是解决课题中的一两个具体问题;对于博士生,则必须有三五个完整的创新点,并以此为基础完成博士论文,这是毕业的硬性要求。去向好,招生难谈起同学们的毕业去向,北语坚持“专业+外语”的复合型人才培养模式。信科大一到大四都开设英语课,本科生的英语专八考试通过率能达到 70%。选择就业的本科生和研究生,除了去外交部、新华社等国家级机构,以及中国银行、工商银行等金融单位从事信息技术相关工作外,还有不少毕业生在 IBM

8、、微软、Google、百度、阿里巴巴、腾讯、新浪等从事软件开发、信息管理、技术服务工作。因为做的都是前沿研究,有意深造的同学也不错,每年都有 50%左右的本科毕业生赴国内外名校读研,如清华、北大、北航、北邮、牛津、斯坦福、帝国理工、加州伯克利、哥伦比亚、宾夕法尼亚、卡耐基梅隆、东京大学等。想读博也不难,如今,每年都有外国高校请北语计算语言学的教授推荐博士生候选人。北语曾邀请第三方机构调查了校友满意度,各院系中信科校友的满意度排名第一。不过校友满意度第一也可能是由于一个令人哭笑不得的原因:没来信科之前,不少同学对北语唯一的理工科学院不了解甚至有怨气,来了后却发现真的很棒,不虚此行。但毕业不愁出路的计算语言学,在招生时却让学院操碎了心。考研时第一志愿填报北语计算语言学的,只要能过国家分数线就能被录取。但每年招的 30 名硕士研究生,还是有近一半要靠调剂,调剂生的平均分数有时候甚至比第一志愿录取的还要高。自豪和无奈,是每一位北语信科人都流露出的情感。他们自豪于自己的前沿研究,自豪于自己灵活的本硕博培养方案,自豪于学生的就业去向,自豪于毕业生对学院的真心热爱。但是,也无奈于本科生招不满,研究生靠调剂的局面。但是金子终会发光,而北语计算语言学,不仅是金子,还是一座蕴藏着金子的金矿。

Copyright@ 2020-2024 m.ketangku.com网站版权所有

黑ICP备2024021605号-1