最新微软官方MSDN原版Win10系统下载

当前位置:主页 > 系统教程 > Win7教程 >

AI如何反低俗?今日头条推内容检测工具“灵犬” 公然其技术原理“首页”

时间:2021-06-25    来源:首页    人气:

本文摘要:男默女泪、不看不是中国人、看完惊呆、身份惊人、不看亏损、癌症凶手……这些标题党文章的习用词汇,还熟悉吗。今日头条公布内容康健度检测工具“灵犬”,不仅能够识别这些低俗内容、暴力内容和标题党,还能支持图片识别功效。 今日头条表现,在文字识别领域,灵犬3.0的检测准确率今后前的85%,上升至91%。图像识别领域,在数据、模型和盘算力方面也做了针对性优化。这一次,字节跳动AI实验室首次揭秘其反低俗系统概况,以及相应的技术原理。 革新了那里?

首页

男默女泪、不看不是中国人、看完惊呆、身份惊人、不看亏损、癌症凶手……这些标题党文章的习用词汇,还熟悉吗。今日头条公布内容康健度检测工具“灵犬”,不仅能够识别这些低俗内容、暴力内容和标题党,还能支持图片识别功效。

今日头条表现,在文字识别领域,灵犬3.0的检测准确率今后前的85%,上升至91%。图像识别领域,在数据、模型和盘算力方面也做了针对性优化。这一次,字节跳动AI实验室首次揭秘其反低俗系统概况,以及相应的技术原理。

革新了那里?这个叫作灵犬的小法式,可以从微信小法式“灵犬反低俗助手”或今日头条内打开。所以,和去年5月的灵犬2.0小工具相比,3.0版的灵犬革新了不少。先是界面有变。

此前的检测界面,分为反色情低俗、反暴力诅咒和反标题党三类,新版将这三者合为一体,统一成了文本识别。△ 左:3.0版灵犬界面;右:2.0版灵犬界面用户只需输入一段文字或文章链接,就能检测内容康健指数,系统返回一个判定效果。

包罗是否可以获得算法推荐,是否需要引入人工判断等。其次,新系统可识别图片,上传图片或其毗连,就能一键检测图片的康健指数。今日头条表现,自去年3月推出一代灵犬开始,到今年6月为止,灵犬反低俗助手的使用人次已经凌驾了300万。

BERT加持字节跳感人工智能实验室总监王长虎表现,和一般的接纳分词技术+词表技术文本识别方案差别,灵犬接纳NLP技术。相比于上一代,灵犬每更新一次,就进化一次。

AG真人客户端APP

王长虎表现,1.0版接纳词向量+CNN技术,训练数据集包罗350万数据样本,对随机样本的预测准确率到达79%。到了2.0版,技术就酿成了LSTM(是非时影象)+注意力机制,前者擅长对序列举行建模,对长句的识别效果好,后者资助对句子全局有一定相识。

此时训练数据集包罗840万数据样本,准确率提升至85%。王长虎表现,3.0版灵犬同时应用了BERT和半监视技术,而且在此基础上使用了专门的中文语料,在不牺牲效果的情况调整了模型结构,使得盘算效率能到达实用水平。这一代“灵犬”训练数据集总量是1.2个T,相当于20倍百度百科或100倍维基百科的数据总量,包罗920万个样本,准确率提升至91%。

量子位此前报道过,说BERT是2018年最火的NLP模型一点也不为过,它甚至被称为NLP新时代的开端。它由Google推出,全称是Bidirectional Encoder Representations from Transformers,意思是来自Transformer的双向编码器表现,也是一种预训练语言表现的方法。王长虎表现,最新图片识别和检测功效的推出,背后也曾面临3个技术难点。

一个图像多尺寸问题,解决方式就是多桶模型,每个桶的模型处置惩罚差别尺寸的数据。这样,既不会增加模型运算的耗时,还能提升准确率。

二是图像多尺度问题,图片中的人像的尺寸和比例差别,因此研究人员构建了特征金字塔。三是小目的问题,也就是说低俗内容只有一点点。

今日头条接纳支解辅助分类网络方案,把低俗位置抠出来,联合区域信息整体分析,解决小目的问题。AI内容羁系员今日头条表现,反低俗系统从2012年就开始建设了。从建立开始,已经把包罗反低俗在内的内容宁静,放在公司最高优先级行列。建立之初,已经专门设有审核团队,其时研发所有客户端、后端、算法的同学一共不到40人。

王长虎表现,灵犬只是今日头条反低俗系统一个检测的窗口,今日头条的反低俗不止于灵犬,另有类似的数百个模型,解决低俗低质、暴力等内容,另有近万人专业内容审核团队。AI取代部门内容审核员的事情,不只今日头条,其他内容平台也都推出过类似产物。今年6月,微信上线了一款叫“珊瑚内容宁静助手”的小法式,只要面向民众号内容运营者和小法式开发者,任何人可一键识别内容和产物是否宁静,是否可以通过检测。

小法式显示,现在能判定图片和文字内容,后续还将陆续上线音频判别和视频判别。再好比想用AI打造智能社区的知乎,去年4月上线了一款专治“答非所问”的机械人瓦力,用机械学习去明白问题下的内容,以快速处置惩罚答非所问和辱骂、贴标签等不友善内容,还能识别阴阳怪气(反讽)的回覆。不外效果也得两面看,上线一年多,已经有不少用户以为瓦力的检测效果略感智障,泛起了识别禁绝、莫名折叠回覆的情况。

固然,也少不了不少社交平台的内容检测玩家。Facebook,一个越活用户近20亿的社交平台,天天面临着C端用户孝敬的林林总总的图片和文字信息,检测这些内容是否合规,还靠AI。它们靠一个名为Rosetta的机械学习系统,能实时从10亿图片和视频中提取文字,识别文字包罗的信息,检测内容的宁静性。

首页

AI已经开始大面积内容羁系人员,节约了大量人力,但又何尝不是另外一场由人力堆砌的事情呢?“灵犬”们还需进化,直到不再需要这么多人的那天。


本文关键词:AG真人客户端APP,如何,反,低俗,今日,头条,推,内容,检测,工具

本文来源:AG真人客户端APP-www.4000070859.com

相关文章

Win7教程排行榜

更多>>

U盘装系统排行榜

更多>>

系统教程排行榜

更多>>

公众号