抄袭和盗版是内容平台的癌症。区块链跟解决盗版和抄袭的问题无关。内容根本没什么值得上链的价值,一味强调只是给没什么应用空间的区块链弄点花活儿。内容存哪里不是存。爬虫也没法彻底解决问题,只能发现这些作品被抄袭和盗版,处理社区内的违规内容。非法转载内容的个人或者网站是否有意愿去清理违规内容跟技术无关。比如简书作者的文章被美文网的爬虫获取并发布,除了递出律师函和向有关部门举报,没有别的有效方法。
对于抄袭和盗版,技术上发挥作用的是爬虫。将站内的内容互相比对,再和站外的内容进行比对,基于结果进行治理。至于面对海量的互联网信息,如何开发出高效和低成本的防抄袭和盗版系统才是内容社区应该关注的。
区块链能解决内容质量降低更是无从谈起。推荐系统可以有效解决内容质量降低的问题,不让用户看到低质量的内容就是。
个性化的推荐对优质作者的曝光起到决定性作用,也是整个内容社区的核心所在。难点是如何避免因概率论导致的平均主义,向用户推送更符合个人审美的内容。基于大数据的推荐系统需要权衡在全体特征和个体细节上做出取舍。通过对个体数据的剪枝得出基于大数据的结论,但是有意义的结论的代价是个体特征的独特性减弱。既要总览全局,又想清楚任何个体的全部独有细节,是不可能的,必须作出取舍。
基于大数据的推荐系统发挥优势的前提在于数据足够大。如果数据不够多,效果不会那么明显。设计推荐系统这类专家系统时,首先考虑的是数据来源和规模。数据量不够大的时候,更应该倾向基于逻辑和规则的工程技术路线。
如何开发相关的计算语义模型,怎么评估一篇文章的内容质量好坏,这是另一个工程技术上的问题,涉及到对内容的理解。如果是文字,那么这属于自然语言处理的范畴。
超凡智能的推荐系统也无法从平庸的内容池里发掘出优秀的候选者。社区本身能否吸纳更多的优质作者,这问题触及灵魂。
听了无数遍去中心化,我也认同去中心化的价值。去中心化应该已经是个业界共识。去中心化的核心其实是怎么区分用户,分别对待,每个用户呆在舒服的小圈子里。
区分不同社群和区块链节点,这应该是去中心化的结果,而不是手段。
中心化的人工推荐和基于大数据的推荐系统本质上是一致的,无非把资源挪了一下,整体数据好看了一些,结果都是导致新的中心形成。基于大数据的推荐,更容易推荐所谓多数人喜欢的内容,他们就是新的中心。平台去中心化的不当措施会过度干预社区的自我生长。去中心化跟大数据的矛盾,值得深思。就这些看来,区块链似乎没有什么应用的空间。
水文和羊毛党的横行,另一个头疼的问题。我更赞同从工程技术找到方法来治理社区,因为人类难以处理庞大规模的数据。社区也没那么多志愿者,都不工作,天天盯着社区的动态。
区块链的价值在于发币和保存用户对社区的贡献数据,在于激励。至于区块链其他的独特功能,我暂时还没发现。区块链对于内容社区是锦上添花的作用,看不出能让社区起死回生的功效。内容社区的技术核心还是在对内容本身的处理上,区块链社区更象征着整体人工智能应用的先进和超前。