博仕书屋
会员书架
首页 > 都市 > 穿越:2014 > 第302章 对《数据安全法》的呼唤

第302章 对《数据安全法》的呼唤(1 / 2)

章节目录 加入书签
好书推荐: 明明很强,却师承霸哥过分稳重 新婚之夜:我被龙女强娶了 DC新氪星 富贵妾 重生之大鄫皇子 逆道斩神 被将军娇宠后我破防了 一秒999刀,我的废体被曝光了! 给秦始皇直播胡亥玩死大秦 云婓

反正绝对不能说这些信息不重要。

至于果子为什么对这类东西感兴趣。

因为收集这类一贯不被视为数据的数据。

实际上通过深耕是能得到跟传统数据差不多的功效的。

而且使用这类数据的话,通过一些概念性的教育消费者甚至可以形成一种企业从来不涉足一般数据的印象。

这对于树立企业形象岂不是很有妙用??

总之,对于既当又立的企业不能说是没有诱惑力。

反正林灰觉得从暗数据入手这倒是符合很多科技巨头的行事风格。

类比林灰以前估量的价格。

如果说几千万美元就能买上千万条双语标注数据。

可想而知像苹果所谋求的价值两三个亿美元的暗数据肯定是一笔相当庞大的数据。

涉及到标注数据跟暗数据一大区别在于标注数据是结构化进行过一定处理的数据。

而暗数据很大程度上是未被结构化处理甚至很是“乱糟糟”的数据。

结构化的数据一般是即有固定格式和有限长度的数据。

例如填的表格就是结构化的数据。

比如说“国籍,种花家,民族:汉,性别:男,姓名:张三,年龄:……”

这种格式的都叫结构化数据。

这类数据很容易以固定的格式存储到数据库里。

而半结构化数据值得是一些l或者tl的格式的数据。

对这类数据当根据需要可按结构化数据来处理,也可抽取出纯文本按非结构化数据来处理。

所谓的非结构化的数据:就是不定长、无固定格式的数据。

例如网页,邮件,有时候非常长;有时候非常短,几句话就没了,这类就是典型的非结构化数据。

子啊比如说例如wrd文档、语音,视频、图片都是非结构化的数据。

而半结构化数据和非结构化数据,一般合二为一统称为“暗数据”。

这个词语也不是林灰定义的。

相比于标注数据这种结构化数据,暗数据同标注数据此二者的价值是不可同日而语的。

单位标注数据的价值往往几十倍甚至于几百倍于单位暗数据。

两三亿美元就算是换取较为昂贵的跨语种语言类标注数据都能换上几亿条。

更何况说拿几亿美元去换暗数据呢?

可想而知,两三亿美元涉及到的暗数据是一笔相当可观的暗数据。

林灰那有很多前世的信息。

但也绝不可能有满足苹果胃口的暗数据。

不要说是林灰前世那点信息了。

就是像国内有的忝居互联网巨头之列外强中干的互联网公司所拥有的暗数据规模也未必能满足苹果的胃口。

这种情况下如果林灰对苹果的这笔巨额收购感兴趣的话似乎只能去收集暗数据了。

至于如何去收集呢?

暗数据的收集方式多种多样。

因为暗数据包括用户活动日志、客户对话或电子邮件记录、服务器监控日志、视频文件、物联网产生的机器和传感器信息。

暗数据还可能包括由于存储在过时设备上而无法再访问的数据。

这种情况下很多时候清理活动日志或者说收集存储碎片的时候都有可能顺手牵羊搞到一些暗数据。

点击切换 [繁体版] [简体版]
章节目录 加入书签
新书推荐: 这个书生有点狠 法师之上! 我不是文豪 华娱,不放纵能叫影帝吗? 美食:便衣摆摊,逃犯催我快上班 重活一世,我一书封神 替弟从军成将军,归来问我要战功 我的化身正在成为最终BOSS 阎浮武事 华娱之学院派大导演