抢了人类编辑饭碗的AI算法,会完胜吗 - 图书行业

TUhjnbcbe - 2023/7/28 21:21:00

中科白癜风微博 http://baidianfeng.39.net/a_yqhg/140805/4440912.html

图片来源

视觉中国

文丨脑极体

AI夺权，“备胎转正”的戏码，在媒体行业再次上演。

5月底，微软宣布将解雇50名从事新闻报道筛选和策划的编辑，取代他们的正是已经与这些人类编辑们共同工作了一段时间的AI编辑。

受此影响，英国新闻协会负责在MSN网站及微软Edge浏览器上维护其新闻主页的约27名编辑，被告知将在6月底被解雇。

尽管微软特别声明，此次裁员和新冠疫情大流行导致的新闻媒体的广告收入下滑，没有直接相关，但通过AI技术来削减新闻团队的人力成本则已经是一个不争的事实了。

对于这些无奈“中枪”的新闻编辑来说，曾经为他们提供各种新闻、筛选建议的AI算法推荐，竟然是这样一个“暗中磨刀”的心机AI。

在报道中，一位即将被辞退的编辑人员强调，完全用AI替代人工是有风险的，因为只有人工编辑才能确保网站不会向用户显示暴力或不适当的内容。这对于AI来说，这确实会是一个问题，因为它更擅长推荐那些符合人性的内容，但却无法识别一些潜在的社会伦理风险。

当然，微软自从年推出MSN新闻业务以来已有25年的时间。现在在全球至少有多名编辑仍然在从事着新闻的筛选和推荐工作。未来微软的新闻团队仍然还会以人工编辑和AI编辑共同协作的方式，只是AI取代人工编辑的趋势可能在明显加速。

站在普通吃瓜群众的角度，我们也正被各种新闻资讯、视频平台的算法推荐所支配，最显著的体会就是我们花费越来越多的时间在那些让我们“欲罢不能”的内容上面。

难道说，AI将在取代人类编辑的战斗中取得最后的胜利吗？我们从AI算法推荐的上位和争议中，来探究下AI算法与人工编辑推荐可能的胜负结果。

信息分发：从“人找信息”进入“信息找人”

“太阳底下无新事”。算法推荐，尽管只是近几年随着移动互联网内容应用的爆发才兴起，但其实质上仍然只是人类进行信息分发的一种新形式，而我们对信息分发的需求自古就有了。

赫拉利在《人类简史》中提出一种智人种之所以战胜其他物种的新“假说”，那就是我们特别擅于“八卦”和“聊天”。“八卦”有助于让整个社群建立情感纽带，团结起来共进退，“聊天”有助于经验的传授，外出的告诉村里人哪里有危险，老猎人教会小猎人如何抓猎物。这就是最天然的信息的社交分发，极大提升了人类之间的协作效率和文明的延续。

此后我们经历了口耳相传的史诗，结绳记事、甲骨篆刻的符号记录，以及再后面的文章典籍；现代文明的兴盛得益于印刷术的不断升级，而到了近两百年左右，新闻报纸、图书出版、广播电视等全新的信息分发媒介诞生，构成了当代社会的信息分发的基本版图。

互联网的出现又突破了信息分发的时空界限，让信息可以实现永远在线、全球同步的传递。不过传统互联网的信息传递仍然延续了物理世界的范式。比如，互联网早期兴起的门户网站和搜索引擎，就是借鉴了图书馆的目录分类和和百科全书的条目索引。

新闻资讯等信息的分发依赖权威化、中心化组织的采集和报道，用户的信息知识的获取依赖主动地浏览和筛查。

随着信息的爆炸式增长和人们信息消费的碎片化趋势增长，“人找信息”的方式遭遇了全新挑战。算法推荐和相应的内容分发的平台的出现，开启了通过人类通过机器算法推荐的方式进行“信息找人”的全新模式。

年，尼古拉·尼葛洛庞帝在《数字化生存》当中带有预言般的“我的日报”的想法，现在成为了现实。信息分发正在朝着满足受众用户个性化的需求的方向发展。

几乎就在同时，美国明尼苏达大学的团队开发出了第一个自动化推荐系统GroupLens，成为协同过滤推荐算法的最早提出者。此后，算法推荐系统在亚马逊的电商平台、Netflix的视频流媒体服务当中也很早便投入了使用。

年，可以算是新闻算法推荐崛起的元年。这一年，YouTube将深度神经网络应用到内容推荐系统中。这一年，我国新闻资讯信息分发市场上，算法推送的内容第一次超过50%。

也正是这一年，率先应用信息算法推荐的今日头条，终于从四大门户和BAT支持的媒体平台中突围，实现了万的日活。

但此后算法推荐本身一直争议不断。在年9月，人民网特意用三篇社评的篇幅批评了今日头条这类新闻应用的“算法推荐”。社评里自然首先肯定了算法推荐顺应时代潮流，满足人们个性化、多元化的信息获取需求，但又专门指出了以下的问题：

算法推荐会纵容低劣内容的泛滥。一些推荐算法只会迎合大众的猎奇心理，最后只会反复推送那些低质量内容，最终“劣币驱逐良币”，使得传统媒体的优质、全面的资讯信息无法触达大众用户。

推荐算法中所谓的“个性化”推荐，只会机械式地推荐一些关联性强，但内容单一的信息，甚至会过滤掉那些不熟悉、不认同的信息，造成“信息茧房”。

算法推荐的信息抓取不仅可能涉及到大量的版权问题，甚至还可能走向“创新的反面”。就是智能推荐将走向媚俗化和庸俗化，充斥大量缺乏独立思考、深度观察的肤浅内容，反过来破坏社会的创新发展。

人民网的批评，同样也代表了众多传统媒体和众多精英人士的观点，而且这些现象确实也符合我们大多数人的直观印象。但是在附和之前，我们仍然需要进一步了解下算法推荐的基本方法和发展，搞清楚人们为什么会如此容易被算法“驯服”。算法推荐又该如何突破自己的局限而持续进化？

算法推荐：人性的，太人性

信息分发的本质，就是有效地联接人和信息。而算法推荐的本质就是运用机器算法实现大规模的自动化信息分发，让信息自动找到人。

因此，算法推荐需要解决三个问题：了解信息，了解人，了解人何时何地需要这些信息。不过，归根到底，算法推荐的核心还是了解人，即了解人的使用习惯、兴趣爱好，再通过算法预测用户可能感兴趣的信息和话题进行加权推荐。

新闻信息的主要推荐算法都是来自于一些数学算法。在各大新闻资讯聚合类应用上主要使用以下这些算法：

1、内容推荐。这是资讯类推荐最常用到的算法。算法系统通过对文本内容进行标签设定，一旦用户对相关内容进行过点击、浏览、点赞、评论、分享等操作，系统就会对用户打上相应的兴趣标签。这样就可以将更多相关标签的文本进行用户标签的匹配。比如，一个看过“德甲”内容的用户，就会得到更多关于“德甲”的信息推送。

内容推荐，如果先期无法获取到用户的兴趣标签特征，就会容易遭遇冷启动问题。因此，内容推荐之外还需要其他推荐方式。

2、协同过滤推荐。这是推荐系统中应用最早和最为成功的技术之一，采用了我们常识理解的“人以类聚，物以群分”的思路，即找到用户的好友或者与其相似特征的其他用户那里，将他们感兴趣的内容来推荐给该用户。

协同过滤推荐采取了经验共享的方式，避免了内容推荐中存在着内容分析不准确、过度单一等问题，可以为用户发现潜在的兴趣偏好的内容。

3、热门推荐。热门推荐来自于传统媒体的思维方式，主要是基于当前热点新闻事件和话题进行的内容推荐。区别于传统媒体由新闻编辑进行的人工筛选，新闻聚合平台的自动算法推荐更在于通过数据统计的方式将一段时间内点击量、