中国数据新闻大赛——从参赛到获奖,体会跨学科思维逻辑的相互融合

    新闻,一直以来是大众获取信息的主要来源,一代代的媒体人在不断尝试探索出最客观、最及时的信息传播方式。于是,随着大数据时代的发展,基于数据抓取、挖掘、分析的数据新闻应运而生。


    数据新闻(data journalism), 也被称为数据驱动新闻(data-driven journalism), 是指基于数据的抓取、挖掘、统计、分析和可视化呈现的新型新闻报道方式。作为技术创新驱动下的一种新型新闻形态,数据新闻为传统新闻生产注入了新鲜血液,同时利用多维度新闻叙事模式和多元化数据呈现方式将新闻报道与数字技术的融合推向了时代前沿。


    大赛简介

    中国数据新闻大赛创立于2015年,由西安交通大学陈积银教授发起,现已成功举办九届,第十届将在UIC举办。作为中国新闻教育学界的专业比赛,中国数据新闻大赛培养了优秀的融媒体内容制作人才,被誉为“新闻传播教育转型的风向标”。不仅如此,作为全国新闻教育学界唯一持续举办的专业性比赛,中国数据新闻大赛在整个社会层面的影响力日益扩大,为开展融合新闻报道注入了青春血液。在即将到来的第十届中国数据新闻大赛中,UIC学子们将拿出怎样的精彩参赛作品令人期待。


    参赛的心路历程

    从鼓起勇气参赛,到透过梧桐叶洒下斑驳阳光的那个清晨,走进答辩教室的一刻,直到站上华中科技大学的颁奖台,我才恍然意识到,UIC见证着我的蜕变与成长。在这段旅程中,每一步都充满了探索的艰辛与收获的喜悦,而母校的支持与陪伴化作漫天星光,点亮了我前行的道路。


    我是22级UIC媒体与传播学(MCOM)本科在读的朱玺冰,出于自身对大数据技术和人工智能信息传播的热爱,我报名参加了第九届的中国数据新闻大赛。经过省赛、网络投票、国赛约三个月时间的激烈角逐,我们的团队最终晋级国赛决赛,11月30日,在武汉华中科技大学现场答辩环节,我们的团队最终荣获该赛事国赛二等奖的殊荣。



    递交参赛申请后,我们需要在两个月内完成团队组建新闻主题抓取大量的相关数据,进行清洗、分析,最后将处理后的数据集成到作品中h5或推文等线上形式呈现。这对我是一种全新的挑战,我需要在完成学校课业的同时进行作品的构思与搭建。


    迅速组建好团队后,我们开始对主题进行头脑风暴,在无数版主题被推翻后,我们最终确立了以阅读为核心的用于处理负面情绪的阅读疗法作为主题,探索使用阅读行为缓解负面情绪,改善心理健康。在确认主题后,我们别出心裁地想到制作一个属于我们主题的Logo,利用类似书本排列摆放的图标设计和阅读疗法的英文名词"Bibliotherapy"等相关元素合成了我们最终的Logo。



    在我们的作品中,首先以Manner咖啡店店员情绪失控为引入,提出阅读疗法这种可以化解负面情绪的方式,并基于阅读疗法进行了三部分的数据提取、分析工作。数据提取部分主要运用爬虫对相关的URL地址进行HTML解析,并通过XPath等技术获取需要的信息;在数据分析部分,根据数据特性和可视化表达方式,综合运用了Python, Tableau, Fine BI, Excel, PPT, 3D文字云, Echarts, Flourish等作为数据分析工具,对网络爬取出来的数据,进行了数据清洗分析、梳理和汇总工作。同时进行数据可视化,使复杂抽象的数据更加便于读者理解,能够发现当中的趋势和关键内容。


    创作历程

    第一部分,我们分析新浪微博在事件发生后一周的舆情声量,在爬取这一周内所有的微博数据,总结得出Manner咖啡事件以55286条推文以压倒性的热度位于舆论的浪尖


    同时在新浪微博抓取事件相应微博的全部评论数据,并选取了从6月17号至7月30日的微博,共爬得微博数据25000条,由于有一些微博的内容是完全相同或基本相同的,我们使用了文本匹配的方法将内容完全重复的微博评论进行清洗。此外,针对微博中含有大量的符号、表情图标等无关内容的评论进行相应的数据清洗操作。最后得到实际有效的微博23339条。                        

     



    第二部分,我们获取了当当网2020-2023年书籍畅销排行榜数据,发现这四年间位居畅销排行榜前五名的绝大部分书籍都为疗愈型书籍。这说明很多读者在潜移默化中已经开始使用阅读疗法改善自己的负面情绪。 




    在第二部分,我们利用爬虫获取了当当网、豆瓣读书关于上文里提及到的在榜疗愈型书籍的评论区,获得了共10519条数据;同时根据参考文献中提供的大学生主要心理问题数据和不同群体接受阅读疗法的数量在比对后进行了数据可视化处理。



    第三部分,对于阅读疗法的疗效和可行性,我们提取了大量新浪微博、当当网、豆瓣读书评论的数据,结合宫梅玲老师《读怯心病》书籍中39个关于阅读疗法的典型案例提及的疗效追踪-阅疗感悟,对阅读疗法的可行性和作用做了分析,发现阅读疗法效果显著,对于患者的情绪改善有很大的帮助。


    回顾与反思


    这是我首次参与数据与新闻结合的比赛,这对我而言是一种不小的挑战,在无数的夜晚坐在电脑桌前,我不断思考着如何获取更加丰富且纯净的数据,如何提高新闻的可读性,与其他熟知了解数据新闻的队伍不同,这是我首次接触全国数据新闻大赛,我只有三个月的时间带领团队从零开始创作,从生疏到熟练,从最基础的理解到灵活的运用,是数据新闻给予我的一次次进阶。这次获奖离不开在背后支持我的家人、朋友和指导老师,他们在我迷茫时给予我前行的方向,就像船舶离泊港湾,永远会期待下一次靠岸。UIC的指导老师陈钰滢老师,不仅仅是我的导师,更像是关切的朋友和引导者,她在学术上提供了宝贵的指导,也在生活中给予了无尽的支持和鼓励。



    数据新闻让我记忆犹新的是制作答辩PPT的那一晚,团队齐聚在学校的机房里,由于课业繁重,来自期末周的压迫,我们只有一个晚上的时间决定答辩展示的内容和最终效果。经过一晚上的精心制作,当团队离开机房的那个早上,我们感受着清晨空气中潮湿的温度,彼此笑着道别。


    展望与希翼

                               


    (黄煜院长在开幕式现场代表学校接旗)


    第十届中国数据新闻大赛将由UIC主办,相信会有更多的优秀学子参与进来,创造出更多的优秀作品。一点浅薄的建议给所有未来即将参与中国数据新闻大赛的“小白”们,保持对新闻的热爱,组建适合自己的团队,时刻把握作品的创作进度,大胆地与机构、部门沟通获取数据,积极利用身边的资源。要相信你们的努力一定会在名为胜利的土壤里开出最绚丽的花朵。


    作者 | 朱玺冰

    最后更新:2025年01月02日 15时48分