当前位置>主页 > 期刊在线 > 信息技术 >

信息技术22年16期

自媒体 APP 中医药多模态语料库的构建研究
王越¹,彭咏梅²
(江西中医药大学 人文学院,江西 南昌 330004)

摘  要:通过从微信、微博、抖音等自媒体 APP 中采集中医药相关视频,运用多媒体标注软件 ELAN 进行语序转写和文本标注,从而构建中医药多模态语料库。多模态语料库在文化的语境再现、还原度和时效性等方面的表现比单模态语料库更为卓越。文章从构建现代中医药多模态语料库的方法和使用的理论基础出发,探讨了自媒体 APP 中的中医药多模态语言材料的收集、标注内容方法和建库技术等内容,以期为中医药事业发展提供一定的实证支持。


关键词:多模态;语料库;中医药;构建研究



DOI:10.19850/j.cnki.2096-4706.2022.16.002


基金项目:江西中医药大学校级研究生创新专项资金项目(2021jzzdxkx010);江西省教育厅研究生教学改革课题(JXYJG-2020-165);江西中医药大学校级教改课题(2020jzyb-21);在建课程“英语(博士研究生)研究生课程思政示范课程”(2020-034)


中图分类号:TP311.1                                       文献标识码:A                                     文章编号:2096-4706(2022)16-0006-04


A Study on the Construction of We Media APP Chinese Medicine Multimodal Corpus

WANG Yue 1, PENG Yongmei 2

(College of Humanities, Jiangxi University of Chinese Medicine, Nanchang 330004, China)

Abstract: By collecting medical related videos from WeChat, MicroBlog, Tiktok and other We Media applications, and using the multimedia annotation software ELAN for word order transcription and text annotation, a multimodal corpus of traditional Chinese medicine is constructed. The performance of multi-modal corpus is better than that of single-modal corpus in the aspects of cultural context reproduction, reducibility and timeliness. Starting from the methods of constructing modern Chinese medicine multimodal corpus and the theoretical basis of its use, this paper discusses the collection of Chinese medicine multimodal language materials, the method of labeling content and the database building technology in the We Media applications, in order to provide certain empirical support for the development of Chinese medicine.

Keywords: multimodal; corpus; Chinese medicine; construction research


参考文献:

[1] 徐晗 . 中国特色社会主义文化发展规律研究 [D]. 南京:南京师范大学,2021.

[2] 金湛,陈高,赵宇略,等 . 基于培养医学生中医药文化自信的特色校园文化活动创建初探 [J]. 文化创新比较研究,2020,4(1):138-139.

[3] 宋心蕊,赵光霞 . 我国网络新闻用户规模达 7.31 亿新闻媒体保持技术敏感 [EB/OL].[2022-05-26].http://media.people. com.cn/n1/2020/0428/c120837-31691333.html.

[4] 胡钰,王嘉婧 . 中国新媒体研究报告:2019 年中国新媒体发展综述 [EB/OL].[2022-05-30].http://www.ce.cn/xwzx/gnsz/gdxw/201912/05/t20191205_33784576.shtml.

[5] 王宏,陈小申 . 数字传播与新媒体技术 [M]. 中国传媒大学出版社,2010.

[6] CODD E F. A relational model of data for large shared data banks [J].COMMUNICATIONS OF THE ACM,1970,13(6):377-387.

[7] 何婷婷 . 语料库研究 [D]. 武汉:华中师范大学,2003.

[8] 张国霞,蒋云磊 . 基于 ELAN 软件的护理英语多模态语料库构建研究 [J]. 医学教育管理,2019,5(6):548-551+556.

[9] 谢文利,林凤,唐东昕,等 . 基于 CiteSpace 的医药语料库文献计量学分析 [J].世界科学技术-中医药现代化,2021,23(5):1523-1531.

[10] 蓝洁 . 基于 ELAN 软件的多模态动态视频个案的话语分析 [J]. 九江学院学报(社会科学版),2020,39(3):90-97.

[11] 晓艺,高挺挺 . 基于 ELAN 软件的平行语料库加工处理系统设计 [J]. 自动化与仪器仪表,2021(10):136-139.

[12] 王青羽,顾艳华,肖群杰,等 . 中医药文化媒体的多模态话语意义建构 [J]. 科技传播,2021,13(7):72-76.

[13] 操镭,尹蔚彬,孙沁瑶,等 . 濒危语言口语语料库的研究与构建——以吕苏语为范例 [J].计算机工程与应用,2018,54(2):234-238+245.

[14] 吴蕊珠,李晗静,吕会华,等 . 面向 ELAN 软件的手语汉语平行语料库构建 [J]. 中文信息学报,2019,33(2):43-50.

[15] 孙筱玥,付南钧,杨炼,等 . 计算机专业手语语料库的建设研究 [J]. 智能计算机与应用,2015,5(6):101-102+107.


作者简介:王越(1995—),女,汉族,陕西西安人,硕士研究生在读,研究方向:多模态语言学;通讯作者:彭咏梅(1980—),女,汉族,江西宜丰人,副教授,博士,硕导,研究方向:多模态语言学。