设万维读者为首页 万维读者网 -- 全球华人的精神家园 广告服务 联系我们 关于万维
 
首  页 新  闻 论  坛 博  客 文  墨 黄  页 分类广告 购  物
搜索>> 发表日志 控制面板 个人相册 给我留言
帮助 退出
     
  汪 翔
  讲点自己也爱听的故事
网络日志正文
似神似鬼 2017-08-28 07:05:55

第十五章  似神似鬼

 

丁宗锐还在伽马大学读书,开学后就是最后一年做毕业论文。这时,远在伽马城的重泽鑫正在通过远程教学系统给学生讲课。在海岛游玩的丁宗锐,则坐在海边一块岩石上,正聚精会神的观看着重泽鑫的演讲。

重泽鑫一直以逻辑严谨,数据准确著称。他被誉为这个时代国内最聪明的头脑。

这一次他使用了很多数据来说明他的论点,表面上看,和过去的风格完全相同,似乎是更加娴熟。很多人听了演讲,不会太在意演讲者所使用数据的准确性。可是丁宗锐不同,今天则更是异常。不知道是因为什么原因,最近的她,对于这个人产生了特别的兴趣。为此,她还专门编写了一个软件,用来对重泽鑫的演讲内容进行一贯性和准确性分析。重泽鑫是名人,又以严谨和充满智慧著称,对于自己的分析,他应该就是最佳的选择测试对象。

最近十多年,关于换脑,生产人类部件,置换大脑内部微控制装置,以及相关的技术进步的新闻和传言越来越多。各国也断断续续的颁布了不少的戒律来禁止人们在人类自己身上下太多的功夫。即使如此,有被置换的人在社会上活动,依然是若隐若现的传言。

既然有假的存在,那么,如何识别假冒,就是一件重要的工作。丁宗锐于是想。

年轻人喜欢对看上去捉摸不透的谣言产生兴趣,丁宗锐则更是对于看上去莫名其妙的可能性产生兴趣。于是,她花了不少的功夫做研究,并且为此学习了好几种软件编程技术。一年下来,就有了现在这样的结果。现在的程序员已经不再是昔日的“码农”可比,很多程序化的编程工作,已经有机器人助手帮助解决。优秀的程序员,更多的是优秀的应用数学家。他们的工作,主要是把握程序的主体规划和逻辑思路,做的是构架师的工作,细节性的部分,机器人会为你实现。

 

重泽鑫在演讲里使用了很多的科技术语和逻辑,还引用了不少的典故和数据,她用自己的软件分析的结果发现,重泽鑫对数字的准确率高达百分之百!她觉得这有点太过分:是人就得犯错误,不犯错误的,应该就不是人!

她觉得很有趣:这个人还真的很厉害。以前她也对不少的演讲者的内容进行过类似的分析,除了那些照本宣科念的人外,做即兴演讲的,没有人有如此之高的准确率。她在想,这到底是因为他的水平高,还是因为他就不是普通的人?

她随即通过无线通话系统,叫了远在伽马城伽马大学的朋友。

“老久,在吗?”

“对不起,请留言。”那一头是一个电子人模拟老久产生的语音。现在,人们早已经不再喜欢用自己的个人语音来预设留言提示了,特别是年轻人。再者,通过留言来沟通的人,也越来越少。大家要么用文字,要么用图像,反倒是对于最普通历来最容易使用的语音,开始生疏了。

这位被她叫做老久的人实际上并不老,和她同龄。正在伽马大学就读,是她的校友。趁着假期她出来溜达,而老久却依然龟在他的实验室和办公室,做着旁人看来莫名其妙的事情,在这点上他们两个人非常相像。

不久之后,老久回电:“老祖宗,你鬼到哪里去了?这么久不和我说一声。”

“想我哪?”似乎是期待被肯定的请求。

“哈哈,鬼才想你呢。”语气之中带着矫揉造作的不屑。

“真的?才子佳人,郎才女貌,忘哪?”她明显的在撒娇。

“呵呵,看你美的。正好我耳边可以清静点,难得的好时光。”是老久得意的声音。

“看来,你收获不错。等有时间再和你谍报、谍报。”她说的话,只有他们两个人听的明白,旁人听的迷迷糊糊,还以为是两个神经不正常的人在唠嗑。现在的人,喜欢自己创造一些只有和自己对话的人能够明白的语言,他们称之为密语,使用这样的密语,不怕有人“偷听”。类似于昔日特工用的密码,只是没有那么复杂高级罢了。采用科技手段,在获得足够大的样本之后,再通过机器分析,很容易破解。

“你找我肯定是有事。”

“哎,没事就不能找你?想你还不成?”

“想我,你这样的势利鬼?”

“不和你磨牙了。现在有非常重要的谍报工作需要你来完成。”

“真的?我已经准备好,待发!”一听说她弄来了谍报事务,他就兴奋。两个人神神秘秘的,依然像没有长大的孩子,喜欢着迷一些在成年人看来稀奇古怪的事。

“我想对重泽鑫历年来的所有演讲内容的逻辑严谨性,数据准确性,时间序列上的一贯性,做完完整整的分析。再者,还需要对他从小到大的生活、消费习惯和活动规律,做时间序列上的规律性和一贯性的分析。”

“这可是非法的?!”他是懂法律的。对于这一代人,尊重隐私权是个很重要的议题。

“哈,你什么时候干的是不非法的事情。就别假装正经了。做好了有奖励。”

“真的?”

“当然是真的,而且还是大大的奖励。到时候你自己选吧。好了,就这样,有结果告诉我。谢了。不和你磨牙了,我还得玩去。”

“好的。你乖乖的游山玩水,我好好的认真工作。”

“真乖。吻一下。”说着,她给他送去了一个电子热吻图像,吻后还会冒出一股青烟,看上去像来自于一个鬼怪和幽灵:一个热吻,就能让人变成鬼魂。

 

她在做的,实际上就是“音迹”识别。

告别了老久之后,她租了一艘小船,去了台湾的花莲。那里的原始生态独具特色,一直是她喜欢去的地方之一。她下船后,在海边一个专供游客休息的亭子里坐下,要了一杯咖啡和一些花莲特色的小吃和水果,那就是她今天的午餐。

她一边吃,一边从随身携带的小包里拿出一个四六英寸见方的电子装置,放在自己的面前,支起来,眼睛看着大海咆哮的海浪,开始了她的工作。

电子装置是最新型的电脑,由意念控制,也带有触摸和语音控制功能。现在的电脑容量和速度都已经到了昔日难以想象的地步。就说她眼前这个不足一磅重的电子物件,其计算能力早已经超过早期谷歌花重金打造的谷歌狗,那个因为打败世界上所有围棋高手而闻名的家伙。至于内存,早已经不再是个体电脑应该关注的事情,数据多被储存在遥远的数据库里,既安全,又便于使用。昔日每个电脑不得不携带的巨大内存功能,加在一起也是非常大的资源浪费。

萌芽于二十一世纪初,百多年前的面书、亚马逊和谷歌等的出现,彻底变革了人类的生活方式,宣告大数据时代的来临。人类的生活开始被钉在大数据的柱子上,很多漫不经心累积起来的数据,随后变成了个人的人生弱点甚至是污点。那时就有人注意到,每个人那些各种看上去不起眼的,关于普通日常生活的数据,在数据库的累积,长久之后形成的数据对于个人的隐私可能是一种危害,对于国家的安全可能也是一种隐患。接下来,各个国家从不同的层面做了大量的法规制约,来限制对数据的存储和使用。

但是,只要是存在的,就会有被攻破的可能。这些数据在随后很多次被人利用,直接间接的造成了不小的损失和危害。现在,她和老久也在利用这些看上去普通的数据,在做有害于数据主体的人的事情。

 

就在她胡思乱想的时候,老久传来了结果。在告诉她结果之前,他先说了几句:如果哪一天我因此而死亡,一切都是为了你,为了那高尚的,该死的爱情。

他违法地骇客了不少的网站,盗取大量关于重泽鑫的历年消费习惯数据,从很小时候就开始,一直到最近可以找到的。老久说,最近几年的数据相对较少,看来,重泽鑫是明显的变的更加小心谨慎。但是,昔日年少时的习惯,依然在那些看上去没有规律的数据之中表露无遗。

基于这些数据和他最近几年演讲的资料,老久进行了深度分析和对比。

所有的分析都是基于他和她合作最近开发出的软件,他们称它为“音迹识别幽灵”。该软件不仅仅只是一个可以运行的系统,而是一个有着自我深度学习,自我改善的活系统。数据和资料输入之后,系统会进行独立的逻辑思考,再在思考之后调整自己的分析角度,又在这种调整之后再引入更多的相关数据和资料,还有历史性的相关资料和数据。这个系统的最大优点之一是,它可以自己基于需要去补充寻找新的数据。也就是说,它的深度学习具有训练良好的科研人员查找资料的能力,随后再在此基础上基于专家库数据寻找分析的手段和逻辑。

基于对他历年演讲内容的分析,发现了他关注的重点,还有使用的数据和逻辑的特征。

“这家伙可疑!” 丁宗锐得出了这样的结论,这又和自己凭借感觉获得的结果一致。她自我得意起来,看着远处翱翔蓝天的海鸥,她情不自禁的唱了起来。但是,她的歌唱的声调却慢慢的低了下来,最终消失了。她再次陷入了深思。

“不好!”她自言自语了一声,快速的收拾好自己的物件,跑向停泊在不远处的小艇。

“带我回钓鱼岛,马上!”

“好喽”,小艇是自动无人驾驶的,“驾驶员”学着人类的声音说了一声。

她必须马上从那里坐飞机回到伽马城,越快越好。

 

华灯初上时,她已经回伽马城,坐在了老久的旁边,伽马大学的校园里。

她觉得有趣,又将重泽鑫昔日的演讲做了类似的分析,发现远没有今天的准确率高。以前只有百分之九十五左右。难道是他事先有所准备?不然的话,他会不会已经?

说话的口吻倒是有百分之九十的相似度,这是基于唇读技术对演讲视频的分析获得的。

大数据说的是传统数据处理应用软件不足以处理的,那些庞大和复杂的数据集,一个相对概念。由于人类处理数据的能力在不断的上升,大数据的含义也在跟随着发生变化。老久他们现在处理的数据,按照目前的计算速度,充其量只能算是个小型数据集。而在两百年前,全中国所有的计算机合在一起,也很难在如此之短的时间内获得同样质量的分析结果。

速度和效率,永远只是一个相对的概念。

2012年时,技术上可在合理时间内分析处理的数据集大小单位为艾字节。现在人们面对的一个艾字节,只相当于那时候的一个字节,非常不起眼!数据的累积速度之快,规模之大,由此可见一斑。在那个年代,在许多领域,由于数据集过度庞大,而对应的运算速度又有限,科学家经常在分析处理上遭遇限制和阻碍。自1980年代起,现代科技可存储数据的容量每40个月即增加一倍。截至2012年,全世界每天产生2. 5艾字节数据。在光子计算机普及之后,累积的速度则更快,现在是每天高达两百五十万个艾字节的数据。

昔日必须使用数十、数百甚至数千台服务器来同时平行运行软件的“机器海战术”,早已经成为历史。随着大数据被越来越多的提及,有些人惊呼大数据时代已经到来了。早在2012年就有人说:大数据时代已经降临,在商业、经济等领域,决策的做出将日益多的基于数据和分析,而较少基于经验和直觉。实际上,大数据时代的真实到来时间,是没有办法划出来的。在此宣称之前,人类也一直在做数据分析,统计分析和计量分析就是最典型的一种。不同的,只是计算机速度限制带来的程度和深度的差异。

大数据时代伴随着的是对个人或机构隐私权的冲击,随后就有人提出来“被遗忘权”概念:有权利要求数据商不保留自己的某些信息。2014513日欧盟法院还就“被遗忘权”一案作出了一个没有先例的裁定:判决当年的科技巨头谷歌应根据用户请求删除不完整的、无关紧要的、不相关的数据,以保证数据不出现在搜索结果中。

问题是,法律只对守法的人有效!对于大数据的滥用,随后一再的出现。就个人而言,借助于互联网的快速发展,各种各样的个人信息作为附属品都会被不同公司的数据库收集库存,成年累月,这些一段段看没有太多价值的数据,如果放在一起进行统计分析,再基于统计分析的结果和其它的个体与群体的数据进行比较,还有时间序列分析,往往可以获得大量有价值的情报。

人们的消费习惯,饮食习惯,健康状况,爱好喜好偏好,就像人生的DNA一样,可以被完完整整的解读。随后再继续跟踪,个人甚至是国家,将没有丝毫的秘密可言。

对于国家安全的担忧,在最近百年来被一次次的强调,特别是在拥有全功能的机器人之后。在很多场合,机器人和监控系统的功能特点,都基于法律必须事先公告,让民众心里有数。

有些地方,像伽马大学的那个餐馆,还有钱慧光喜欢光顾的那个高尔夫球场,其监控系统和所使用机器人的功能,都被人为的减低等级,有些功能明文规定不可以拥有。

 

对于中国有关大数据的兴趣,日本人早在数据库初步成型时就已开始,累积到现在已经有两百多年的历史。处心积虑,蓄谋已久,老谋深算,这些中国的成语似乎都不足以描述日本人的用心良苦。卧薪尝胆,倒是更合适一些。

这和当年二战之前,日本人就开始派出大量的人员奔赴中国各地搞地理测绘,社会习俗考察是异曲同工。日本人的精明和未雨绸缪的秉性,在一代代的延续,并且得以发扬光大。

日本商人通过一家控股的美国公司,收购了几家小型的中国公司的控股权。随后,又从美国和欧洲的公司派来了技术人员,又是这些技术人员在中国通过国内的网络,一半公开一半秘密,一半合情合理一半偷偷摸摸,地混入了中国国内几家大型的C2CC2P公司的数据库,里面看上去很不起眼的来自顾客的历史数据, 在人不知鬼不觉之中被他们全数的收走。


(版权所有,不得转载)

浏览(13) (0) 评论(0)
发表评论
 
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2016. CyberMedia Network /Creaders.NET. All Rights Reserved.