物尽其用:基于计算机思维的新闻文本挖掘研究——以“中国突发事件数据库”的建设实践为例
以基于新闻报道的中国突发事件数据库建设实践为例,探讨了作为计算机思维重要内容的数据库方法对于重新发掘新闻文本的价值乃至激活媒体资源的启示意义.为此,在对我国传媒数据库建设史和研究史进行梳理的基础上,按照计算机科学的逻辑顺序依次阐释了以下四点内容:一是“结构化处理”的思想,用来将仅供阅读的新闻文本转化为可供挖掘的数据;二是“人机协同”的理念,能够统筹对大批量新闻报道进行数据清洗的工作流程;三是“数据挖掘”的方法,可以对结构化的新闻文本进行统计分析和可视化呈现,获得相关的新知识;四是“三次售卖”的理论,有助于我们转换视角,将新闻文本视为新的数据能源,并探索借助数据库实现转型的可能性.最后,本文对用计算机思维来挖掘新闻价值过程中所存在的问题进行了反思.
计算机思维、传媒数据库、结构化处理、人机协同、数据挖掘
41
国家社科基金青年项目“基于媒介融合的传媒数据库建设与应用研究”15CXW011;国家社科基金重点项目“传媒预警与突发事件数据库建设”项目13AXW012”的研究成果
2019-12-09(万方平台首次上网日期,不代表论文的发表时间)
共9页
42-50