网易精品产品背后的故事:内容运营的三层级
易信晒一晒主题活动,如果有些主题用户刚发出来就把它删除掉,那么之后用户就很难再发这种类型的主题。所以我们需要有这样的部落、这样的情怀。如果说帖子和主题不符合,那么也会相应的做一些处理,同时也会有一些准则告诉用户,哪些信息受欢的,哪些是不受欢迎的。 黑:如何通过人工智能过滤有害信息?黑是违反国家法律法规的信息,为什么要细分这些内容?当要对用户数据进行处理的时候,怎样处理和用户之间的关系,这个是运营要思考的问题。 上图为 2016 年网易清理的 300 多亿的垃圾信息,这么庞大的数字对运营来说应该如何处理? 网易在做这个事的时候,从宪法到司法解释,参考了很多的法律法规,对这样一个体量的信息做了梳理,不然用户会带着不好情绪问凭什么删我的东西?所以网易对于每一个垃圾分类都是有法可依。 有害信息分类的体系是什么样的?三个层面,国家安全、社会安全、民生安全。 国家安全是高压线,每一个专项都有专人跟进,因为不同逻辑信息的表现是不一样的。 社会安全需要重点说一下。网易的产品还有电商比如考拉海购等,不同的产品的做法是不一样的,比如像色情中小说类的展现和社交类的,然而社交类做直播的又不一样。违禁是根据国家的法律法规区分一些禁止销售的产品。网易会对这些有害的信息进行一个梳理,针对不同的模块对症下药。 有害信息的七十二变为了保证用户第一时间看到的不是有害信息,我们会对这些信息做一个辨令,比如说QQ群的近音字“QQ勤”。我们会去做一些辨别,对这些内容做一个梳理。有人说这种情况做一个关键词就好了,关键词的问题在于简单粗暴,会存在正常语境的情况,比如 “口交” →“ 24 口交换机”?所以这时候如果用很直接的方式的话,用户的体验是非常糟糕的。所以我们会把中国的汉字进行深入研究,包括中文语法的研究、汉字的研究,目的就是为了抗干扰。 但最终整套安全是要走向体系化和智能化(注册保护、登录保护、活动反作弊、反垃圾等)。很多运营刚开始的时候会提倡注册量,之后看到很多疑似垃圾注册的数据,具体表现为随机产生的无意义字符串,但是当这些账号没有产生交互行为,处理时的依据在哪里?处理后面对用户来申诉你的理由是什么?因此我们需要借助成熟的人机识别技术进行甄别,从科学的角度识别机器人与自然人。此外,在法律依据上,这是一种属于破坏计算机系统的行为(具体参阅中华人民共和国刑法 286 条)。有了科学依据、法律依据后,我们便有依可据了了。同样,我们还有登陆保护,一环扣一环。注册保护、登录保护、反作弊都是基于人机识别,而反垃圾就是从内容的维度进行保护。试想,黑灰产想要低成本提高利润只能借助非法工具,其最终的目的是商业利益(内容上表现为恶意推广),因此多一重保护,就是增加黑灰产的成本。 (编辑:西安站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |