核心阅读:随着信息技术的发展,语音转换文字工具日趋成熟,在广播领域的应用也越发深入。江苏广播为推进媒体深度融合,率先在行业内使用AI内容编译系统,实现广播原创音频转化成为文字稿件并支持二次编辑,这在一定程度上改变了广播媒体由语音生成新媒体文本的生产方式。
关键词:AI内容编译系统 创新应用 新闻文本生产 江苏广播
随着信息技术的发展,语音输入法和语音转换文字工具日渐成熟,新媒体文本的生产方式正在发生着改变。以前广播电视记者只需要生产音频和视频报道,现在则需要同时生成文字文本以适应新媒体平台的需要。江苏广播为推进媒体深度融合,在整合第三方语音识别技术和Unix开源人工智能引擎的基础上,通过独立研发,率先在行业内应用AI技术,开发上线了江苏广播AI内容编译系统,可以实现广播原创音频转化成为文字稿件并支持二次编辑,极大提升了广播内容的网络传播与原创性。在2018年全国“两会”报道中,AI内容编译系统已经提供给在北京的前方记者测试使用,记者可以把音频采访内容实时转化成文字,便于快速编排节目并在新媒体上发布。本文以江苏广播为例,考察AI内容编译系统在广播与新媒体融合发展中的创新应用,探讨它为新闻文本生产制作流程带来的变化以及未来的发展方向。
江苏广播AI内容编译系统的创新应用
江苏广播拥有新闻综合、新闻、交通、金陵之声、经典流行音乐、音乐、文艺、故事、健康和财经十个广播频率以及金陵之声网络台,每天生产大量的原创内容,涵盖健康养生、交通法规、汽车保养等各个方面,原创程度高,具有良好的传播价值。但是在互联网上,单一的音频手段传播利用程度远不及文字和图像,表现力和信息量则不及视频;另一方面由于音频不易被检索,用户消费时间成本高,在互联网上传播受限,也限制了广播媒体在新媒体平台的竞争力。因此,传统广播要推进与新媒体的深度融合,需要将广播节目资源进行二次加工,生产碎片化、图文化、可检索的原创内容,打造具有“网感”的主流媒体平台。
2017年7月,江苏电台开发上线AI内容编译系统,可以实现广播原创音频转化成为文字稿件并支持二次编辑。该系统将人工智能技术融合进了内容生产流程之中,一头与制播网对接,另一头与CMS内容管理系统衔接,联通内容发布平台(微信公众号与“大蓝鲸”客户端),形成一个智能化的内容生产闭环,使得内容的转化和发布得以快速进行,大大提高了广播微信和客户端原创稿件的生产效率。总体来说,该系统有以下三方面的特点:
一是识别准确率高。对于AI语音识别系统来说,识别是否准确决定了系统的应用价值。经过半年多的应用和深度学习,江苏广播AI内容编译系统语音识别的准确度已达到97.5%,而除了常用字词的准确识别之外,技术人员还会定期提供相应的词库供系统进行记忆学习。该AI内容编译系统能够准确识别中英文音频素材,即便是略带方言口音的语音,也能够较为准确地将其转化为文字稿件。
二是不断优化提升用户体验。目前江苏广播AI内容编译系统已更新到第五版,从第一版最先上线的语音转文字功能,到第五版功能基本完善、在江苏广播全频道覆盖,该系统始终注重细节优化和交互体验,致力于新媒体文本生产工作的简化。如在第三版的更新中加入了音频寻址功能,即在具体的编辑界面中,通过选定文字稿件的位置,能够同步定位音频素材中的对应位置,从而解决了音频素材在编辑时难以检索的问题,为后道编辑提供了便利。而在第五版的更新当中,该系统编辑界面分化了各个频道与节目的接口,每个频道或节目都有独立的编辑界面,且具体到每一档节目,通过信道的区分,系统可智能识别主持人与嘉宾,在生成的文字文本中对不同的角色进行自动区分。
三是提升原创内容生产能力。由AI内容编译系统带来的,是江苏广播生产原创内容能力的全面提升。通过整合节目优势,江苏广播将优秀的广播节目内容经过二次加工迁移到“大蓝鲸”客户端,形成具有互联网传播特性的内容平台。2018年3月14日,全国首档通过AI技术生成的广播互联网内容频道《汽车百事通》在“大蓝鲸”客户端上线。该频道内容来源于江苏交通广播网同名节目,由编辑挑选每日节目中的精华内容,通过系统的二次加工,音频节目分割整合成问答形式的文字内容,易读易搜索。目前,该频道已收录159条数据,累计服务38万余人次。
AI内容编译系统在新媒体文本生产中的作用
AI内容编译系统具有音频生成文字文本,根据文字检索音频的极大优势。它能够省时省力地完成文本的二次加工,能够生成文字结合短音频和图片的融合文本,令新媒体文本有更加多元的表现形式,使得广播媒体的网络原创能力大幅提升。
1.高效完成新闻二次加工
在媒介环境正在发生急剧变化之时,新闻报道对时效性的追求,比以往来得更加迫切。如何提高新闻生产效率,在速度和原创力上取胜,是每个新媒体编辑的不懈追求,而这正是AI内容编译系统的突出优势。以往广播节目由于内容过长,用户消费时间成本过高,且不易被检索,在互联网中不易传播,而AI内容编译系统在记者上传音频后能立刻将音频内容转译为文字,且转译的准确率高达97.5%,基本不会出现内容上大的差错。编辑只需在转译的文字中找到自己想要编辑的内容,然后将其复制到Word文档中,进行适当的文字调整和排版,再加入适合的图片,就形成了一篇内容优质的原创新闻。以此生成的新媒体产品既具有主流媒体优质的内容,又包含有利于互联网传播的图文形式,还符合人们网上阅读的碎片化习惯,这样大大提高了广播媒体在互联网上的传播效率和传播内容的原创性。AI内容编译系统生成文字稿的速度是人工难以企及的,它使新闻二次加工的速度和效率大幅提高。
2.可直接在系统中根据文字裁切短音频
在AI内容编译系统出现前,由于广播节目时长过长,编辑在进行内容编辑的时候很难剪裁短音频放到互联网上传播,毕竟从一两个小时的节目中剪裁出几十秒精彩的音频片段实在是要花费大量的时间。而AI编译系统的优势除了能将节目内容快速转换为文字外,还可直接在系统中根据文字裁切短音频。以十九大习总书记报告为例,报告全文3万多字,讲话时长3个多小时。为了方便用户快速了解报告内容,且能够亲耳听到习总书记最直抵人心的19句话,需要编辑根据3个多小时的音频内容截出其中最核心的片段,这在以前是需要耗费较长时间才能做到的。而现在AI内容编译系统就能代替很多人工步骤,将音频上传后,只要在系统中查找到相关文字,点击文字后,就能立刻寻找到文字所对应的音频,一个人在30分钟内,就能从3个多小时的音频中裁剪出相对应的19个音频片段,极大提高了短音频的生产效率。一旦拥有了强大高效的音频生成文字和根据文字检索音频能力,就可以生成文字结合短音频和图片的融合文本,令新闻的呈现形式更加丰富多元。
3.更多扮演素材库的角色
通过实地考察和现场调研,我们看到,现阶段AI内容编译系统并不能直接生成完整的新闻稿件,最多是对音频进行文字化的处理和根据文字检索音频,给编辑提供素材,最终的把关和定稿仍需交给编辑完成。虽然AI内容编译系统已经为新媒体编辑承担了大量耗时费力的初级工作,但它只是扮演了素材库的角色,它转译出的文字仍需进行二次加工方可使用。AI内容编译系统学习能力很强,能够识别多种语言,一些带口音的不标准的普通话也能识别。但中国幅员辽阔,语言更是丰富多样,方言种类很多很杂,极难让系统一一学习,所以如果采访对象说的是纯方言,那么系统就无法准确生成相应文字内容,这时候就需要编辑利用文字检索到相对应的音频,由编辑听音频内容对文字进行校对。另外,口语和书面语差别较大,同音或近音词有时候也会误解,还有说话人语音、语调不同就能表达不同的情感色彩等,这些都是语音输入技术无能为力的,必须由编辑对系统转换出来的文字进行修正,删除一些习惯性的口头用语,规范新闻文字表达,并对系统生成的文字进行适当断句。新闻生产的最终环节,在多数情况下仍需编辑进行人工把关,审核通过后方可发布。由于新闻涉及到政策、伦理、法律法规等各个方面,电脑系统始终不能取代人脑。过于放任语音编译系统自主进行新闻生产必然会埋下重大隐患,因为当报道出现差错时毕竟不能由系统担责。因此,AI内容编译系统只是扮演素材库的角色,为编辑提供需要编辑的素材,而不能直接从事新闻生产。
AI内容编译系统的应用前景
AI内容编译系统的应用,大大简化了新媒体文本生产流程操作,提升了编辑的工作效率。无论是对江苏电台,还是对于其他传统媒体,都有十分重要的借鉴意义和参考价值。考察江苏电台的人工智能应用,总体来说,未来AI系统应用对于传统媒体的融媒发展,将朝着优化生产流程、拓展应用领域等方向探索。
1.嵌入生产流程 推动融媒发展
AI内容编译系统的应用,要解决的不仅仅是采编效率的问题,更要通过后续的推广使用,与其他新媒体工具相结合,实现智能化采编,创造“1+1>2”的效果,实现传统媒体的融媒创新,共同推动融媒发展。江苏广播的AI内容编译系统并非简单的音频转文字文稿工具,而是被嵌入到内容生产的流程之中,整合成为江苏广播整体业务中的一环。目前,系统已经开放给全频率推广使用,如交通广播网、健康广播的采编播人员可使用系统进行日常采访、校对等工作,大大提升了其工作效率。此外,AI内容编译系统已置入大蓝鲸Live互动,全部频率的语音互动审核都会通过该系统进行操作。接下来,该系统将会接入荔枝云,后续会开放给江苏广播电视台全台采编播人员使用。而在今年全国“两会”期间,系统已提供给在北京的前方记者测试使用,记者可以通过与移动云连接的智能话筒,把实时的采访语音转化成文字,便于采访完成后快速写稿并编排节目。
2.实现语音交互 面向社会服务
AI系统目前主要应用于新闻及新媒体文本编辑环节,提升工作效率,而在未来,AI系统能够应用的场景还有很多。利用AI技术,增添更多的功能性应用,打造“服务型媒介”,体现媒体的社会性。江苏广播人工智能发展方向规划为三个阶段,即“面向内容”“面向用户”“面向产业”。目前,其发展布局已经在第二阶段展开,未来将会实现“面向产业”的人工智能发展。所谓“面向产业”,就是要实现语音交互,通过“大蓝鲸”客户端等其他移动终端的应用,与用户实现语音的智能对话,并且应用到社会服务当中去,实现缴费、充值等其他生活服务的应用。
3.技术引领变革 坚守新闻专业
留言与评论(共有 0 条评论) |