文丨刘一诺
内容审核是字节跳动绕不过去的一座大山。抖音在国内所面临的压力,TikTok在海外也没能幸免。
印度一位TikTok创作者上传了一段向女性泼酸性液体的视频,再次引发对于TikTok的广泛争议。大量印度用户表示将抵制TikTok,并在Google Play商店中对TikTok给了1星级评价,导致TikTok的评分一度从4.5星陡降至1.2星。
TikTok正高歌猛进海外市场,印度正是下载量最大的市场,迄今为止贡献了6.11亿次下载,占TikTok全球总下载量的30.3%。
字节跳动的出海梦想已照进现实,内容问题使TikTok深陷舆论漩涡,提升内容审核的精准度和速度,能为Tiktok的全球化进程减少一些阻力。
绕不开的人工审核
TikTok所面临的内容审核难题,是全球互联网公司共同心病。
亿欧智库研究院院长由天宇表示,在全球范围内,随着内容的数字化程度越来越高,数量越来越庞大,内容类型的复杂度不断增强,需要构建与之相匹配的内容管理机制。
近几年,Google、Facebook、Twitter都显著加强了内容审核的力度,激增的内容包括文字、图片、视频和音乐,审核技术正经受着新一轮的考验。
国内市场内容审核团队已成为大型互联网公司的标配。
以短视频业务为例,2019年1月出台的《网络短视频平台管理规范》显示,网络平台开展短视频服务,应当根据其业务规模,同步建立审核员队伍。审核员数量与上传和播出的短视频条数应当相匹配。原则上,审核员人数应当在本平台每天新增播出短视频条数的千分之一以上。
字节跳动为此早已组建了规模庞大的审核团队,同时也在研发人工智能审核技术。
2018年,字节跳动副总裁张辅评曾表示,字节跳动确保对所有推荐内容进行人工审核,字节跳动审核团队人员已超过1万人,其中大部分从事视频审核。
同一年,字节跳动副总裁、字节跳动人工智能实验室主任马维英透露,抖音一直使用人工智能辅助审核,构成人机交互的闭环:平台上有 600 多个机器学习模型,能够自动理解和识别内容;审核人员同时也是标注人员,用标注好的数据训练模型,再反过来帮助审核。
通过自主研发的AI技术,字节跳动节省超过十万的审核人力,人工审核团队却仍被保留。究其原因,除了管理规范的要求硬性要求外,AI审核的技术瓶颈也是原因之一。
AI审核的技术瓶颈
人工智能的局限性在于,不能对所有的媒介形式进行精准识别。
对于图片和视频来说,人工智能介入审核非常有效,因为计算机视觉识别技术相对成熟。机器通过一定时间的训练,都能够识别出敏感类别的内容,比如裸体、枪支等。
在对语音、文字进行分析时,不能达到识别图片和视频的高准确率。不同的文字在不同的语境下,表达的含义可能有所不同,人工智能很难像人一样思考,理解语言的真正含义。背景音和噪音会对识别造成干扰,在方言识别上,AI也略显吃力。
图普科技创始人兼CEO李明强坦言,内容审核目前最大的障碍是语音,国内市场面临方言识别难题,出海企业要针对当地语言配置小语种识别,技术难度大于方言。
在由天宇看来,语音审核在研发阶段需要投入较高的成本,语音内容的精准识别难度较大,语义的复杂性也带来了诸多挑战。
与人类能够对新事物进行思考不同,深度学习技术只能根据既有的数据进行训练,对新出现的不良内容,人工审核进行甄别,对用户行为进行判断,在此基础上,才能总结经验“传授”给AI。
如果AI审核出现问题,平台也需要承担法律风险。
中国政法大学传播法研究中心副主任朱巍表示,AI审核是基于深度学习的人工智能,其中的程序、算法,实际上体现的是一个平台的价值观和法治观。“不管这个技术是由平台自主研发,还是由第三方提供,一旦出现问题的话,平台肯定要承担责任。”
从安全和成本两个方面来考虑,通过AI审核进行初筛,再将疑似有害内容送达人工审核二次判断,依然是内容平台普遍采用的审核模式。
自研技术并非标配
涉足UGC内容的平台日益增多,用户上传的内容作品质量参差不齐,内容审核方面的需求也随之不断增长。引入AI审核工具成为内容平台的必由之路,至于选择自主研发审核工具,还是与服务商合作,要看平台自身的考量。
亿欧从业内人士了解到,字节跳动并未引入外部内容审核工具,可能是出于数据保护的需要。腾讯、阿里、百度等头部互联网企业在内容审核方面都有所布局,如果选择与外部机构合作,可能有将平台内容和数据泄露给竞争对手的风险。 |