在讨论“”时经常出现的一个问题是,多大才算“大”。在很大程度上,这是一个语义问题。一般来说,“大数据”指的是数据集太大,无法在一台计算机上操作或存储。这些数据的数量通常远远超出任何一个人甚至一群人的分析能力。例如,一个人可能要花几个星期的时间才能读完《三体》(大约6000 kb)。然而,这个文件可能是存储在消费者外置硬盘上的数百万个同样大的文件之一,几乎在任何电脑商店都可以买到(一个6TB的驱动器可以存储1,000,000份《三体》),这代表了任何一个人一生都无法阅读的文本量。从这个角度来看,牛津大学ARCUS-b系统是最新的“”。
自2013年以来,认知与进化人类学研究所一直在使用该系统进行高级数据分析和模拟。这个系统,虽然令人印象深刻和有用,但并不能与许多现代云计算平台竞争,目前大约有1500TB的空间。
目前,人类学领域有许多真正的“大数据”项目,如SESHAT数据档案,在某种程度上还有eHRAF数据库。这些数据库是由少数人制作的作品的档案,但尽管它们的规模和范围令人印象深刻,但大多数数据分析师并不认为它们是“大数据”。此外,这些聚合项目中的数据类型很少记录个人级别的数据点。因此,它们代表了巨大的档案资源,但并不一定涉及收集个人数据所面临的道德困境。
然而,一些研究人员利用企业与学术的合作伙伴关系,或者找到了从Facebook、Twitter和其他在线社交网络平台等网站获取数据的方法。其他研究人员利用智能手机和GPS跟踪设备等电子设备被动产生的数据进行研究。这可以通过访问他们的数据服务器来实现,但也可以通过“网络抓取”或下载和重组信息(如用户名、时间戳、帖子、回复、“赞”等)来实现。
我们希望熟是一种与平台间的信任,是安全的个人信息保护,是有效的关联推荐。比如,不要像最近闹得沸沸扬扬的蔚来一样让用户信息被泄露这是最基础的;比如,我喜欢谍战片,你关联推荐《叛逆者》《潜伏》《暗算》这是体贴的;我关注N95口罩,你推荐几个优选卖家也是合适的。作为消费者,我们也并不是一味拒绝广告,而是拒绝自己的时间被与自己无关的广告占用。熟是了解,是信任,而不是被杀的理由。也许掌握好了这个度的平台,才是掌握了真正的用户密码。
实际上,大屏一直比互联网多一些管控,也多一些权威。而且大屏是面向家庭用户的,对数据和算法的精准度要求也没那么苛刻,平台的竞争压力主要还在于内容而非算法。当然,未来是可以追求更加精准的,毕竟一人户家庭已经超过四分之一,二人户或者三人户的收看规律也相对比较好跟踪,基于这样的大数据累积,基于自己的内容库进行关联推荐是第一步,既可以盘活内容库,又可以增加用户活跃度和黏性,在此之上,不管是广告关联、产品推荐、还是更多业务开展,都是事半功倍、顺理成章的。
奉贤区在全市率先成立“大数据沙龙”,同步启用“贤数空间”,汇集十多家大数据相关的企业团队、基层园区社区,共建数据治理、数据赋能孵化基地。旨在通过思想交汇、需求发掘、技术破题将需求导向、问题导向、效果导向有机结合,在基层社会治理中、在服务群众生产生活中真正发挥数据价值。
下一步,区政务服务办将持续深化数据服务体系建设,加强公共数据管理,提升数据服务能级,拓展数据应用场景,不断赋能基层治理,助力数字政府建设。
除了“步数打榜”这些我们习以为常的功能以外,深入应用还默默支撑着基层治理智慧化管理。
相关文章