学术科研

学术科研

当前位置 :  新太阳城  科学研究  学术科研

学术学院 | 北山问道第161讲:毛文伟教授谈“数据挖掘技术在外国语言文学研究中的应用”

来源 : 学工办     作者 : 金馨怡 倪鑫鑫 周小茜     发布时间 : 2023-11-16     浏览次数 : 37

20231110日上午,上海外国语大学毛文伟教授应邀于22幢一楼连廊会议室为我院师生带来一场题为数据挖掘技术在外国语言文学研究中的应用的学术讲座。日语系主任金稀玉博士、副主任王紫薇博士,以及日语系、英语系及翻译系部分老师和本硕学生参加了此次讲座,讲座由副院长、日语学科负责人徐微洁教授在线主持。



讲座伊始,徐微洁教授对毛文伟教授的到来表示热烈欢迎,并隆重介绍了毛文伟教授。随后,毛文伟教授指出,如今正处于网络和AI技术快速发展的时代,如何突破原有学科领域、促进学科交叉融合成为当下学术研究的突破口。毛教授认为,在历史发展进程中,学术研究的时效性日渐受到重视,文科研究逐渐引入具有创新性的成熟手段,而如何合理、高效地收集和利用这些宝贵资源,提高学习、研究的效率和效果,是广大日语研究者和学习者需要面对的一个重要课题。基于此,毛教授就数据挖掘技术在语言学、翻译学、文学、社会研究等方面的应用分享了自己在教学、研究过程中的独到见解。

 


毛教授首先介绍了基于统计学与机器学习的各种数据挖掘方法,并向我们介绍了日本国立国语研究所的语料库开发计划,强调语料库数据搜集分析手段在语言学研究中的重要作用。同时,毛教授还介绍了基于MI-score的搭配强度测定、Python的感情分析工具等,通过形象的比喻深入浅出地讲解了功能丰富的语言学研究技术。

随后,毛教授向我们展示了语料库翻译学及两种研究范式——翻译对比研究与翻译共性研究。从明示化、简化、规范化等角度出发阐释了翻译共性研究的特征。之后,毛教授以Mendenhall1887)的研究出发,介绍了数据挖掘技术中的计量分析法在识别文学作品作者、作品写作时间推断、作品风格分析等方面的独特作用。

接下来,毛教授从基于高频词的公司形象研究、基于MI-score的新闻热点分析、日本每日新闻关键词共现网络等具体实例出发,强调数据挖掘技术在舆情监控、社会热点调查等方面强大功能,进一步激发了在座师生对数据挖掘技术在外国语言文学研究中的应用的深刻思考。

在交流环节,面对同学提出的如何辨别语料好坏的问题,毛教授就语料时代性、文体是否合适、语料库本身代表性三个方面系统总结了辨别语料的方法。毛教授的讲解深入浅出,既有理论高度又有很强的指导性,引起现场阵阵掌声。

最后,讲座在徐微洁教授的精彩总结中落下帷幕。徐教授基于毛教授的细致分享,重申了现代工具技术对于外国语言文学研究的重要性,并期待毛教授能够再次莅临我校指导工作。