2019年9月27日,全国知名大数据专家、电子科技大学教授周涛,应邀在渝隆集团第一届合作伙伴大会上进行了题为《大数据与人工智能创新实践》的分享。

以下为信风智库整理后的主要内容:

非常高兴有机会在这里和大家分享,我今天讲的比较简单,是想通过一些有趣的例子,让大家明白大数据会给我们的工作生活带来怎样的改变。

很多人问我到底什么是大数据?是不是数据量要大到一定程度,才能叫做大数据。大数据的「大」主要是价值大,而不是体量大。

我先给大家讲一个典型的例子:

2006年,德国世界杯八强赛的时候,德国队对战阿根廷队。在德国队参加比赛之前,德国的教练给当时的守门员雷蒙写了一个便签。这个便签上一共写了7个可能参与点球的对方球员名单,并详细阐述了每个球员的点球习惯。包括会不会助跑,左右脚习惯等。德国队门将雷蒙看到后,便把将这张便签藏在了自己的手套里。果不其然,这场比赛在120分钟内没有决出胜负,被拖入点球大战里。

前4个点球中,雷蒙就顺利的扑出了2个,成功让德国以4:2战胜了阿根廷。值得一提的是,前4个罚点球的阿根廷球员动作与便签所说完全一致。我们可以想象,如果你自己是一个领导,如果能够获得这样准确的数据支撑,那将会对你的决策提供多大的帮助。这位德国的教练员不过只是记录了对方主要球员最近十年内的点球习惯,只有一百多条数据而已,却直接改写了比赛的结果。

所以,大数据的价值很多时候并不是因为数据量足够大,因为即使是很小的数据,也可以产生巨大的价值。

大数据和人工智能已经开始改变我们的生活,未来甚至会改变我们的劳动力和劳动结构。

大数据的首要价值是「真相」

大数据的第一冲击力,并不是它的数据挖掘能力,也不是基于大数据技术的公共产品,而是告诉人们真相。

我是一个几乎不吃早餐的人,有人劝我说「你不吃早餐,将来会得胆结石」,但到目前为止我还没有得胆结石。我的一个朋友尿酸高,特别喜欢喝啤酒吃海鲜。

终于在前几年出现了痛风的症状,全身很多关节疼痛。在那之后,他彻底戒掉了啤酒和海鲜。还有许多人,要知道,酒是一级致癌,不管你喝多少都对身体有害,高度白酒饮用超过二两就会对大脑造成不可逆的损伤。

这些对身体有害的行为,因为不会及时体现出来,所以大家都会他们视而不见,继续抽烟喝酒。但我们可以想象,通过大数据和智能设备,比如纳米机器人等,将这些有害的行为进行量化。也许有一天,这个时间不会很长,我们可以通过向智能设备,实时查看我们的健康情况,看看我们还能活多久。

就像游戏中的「血条」一样,当我们抽一根烟,或者喝一杯酒,血条就会减少和降低。通过这样的方式,我们就会懂得去怎样管理我们的健康。

大数据如何改善政府治理

我们之前做过一个项目,在谷歌上下载十多万张街景图片,并拿出其中的2000张图图片,随机给大家展示。人们在看到这张图片的时候,要根据自己的感觉,对这些街景给予安全性评价。最低0分,最高10分。

我们在用了60多天时间,收集了大量的评分结果。随后,把这些结果交给计算机通进行深度学习,寻找街景中的背景、街道和建筑等东西与安全性的关系。就是说让计算机和普通人一样,分辨出哪些地方安全,哪些地方不安全。

有了这些打分,我们可以获得什么呢?我们可以让城市的管理者,哪些地方是老百姓认为最不安全的,哪个地方是老百姓认为最脏乱差,哪个地方是老百姓认为基础设施有问题等。

我们甚至可以去评价一个地区的领导人,你做的每一项工程到底带来多少效益。老百姓的说法和声音,我们要用计算机去告诉领导们。

这些例子实际上代表了一种新的社会治理方式,虽然运用的是大数据和人工智能技术,但背后的理念是规模化、自动化、定量化和客观化。

大数据如何改善教育

把大数据和人工智能在教育上应用,我们的期望是实现「变化」。

第一个变化是把原来定性的一些观点,用定量化的方式来解读。比如读中学的孩子,如果特别痴迷于看科幻或者武侠小说,那么家长怎么决定,到底要不要他看这些书,它对学习到底有多少影响?

再比如许多家长禁止学生在高中时期谈恋爱,因为会影响学习。但在我去瑞士当助教的时候,如果某个学生上了大学还没有谈恋爱,那多半会被人歧视,是一个非常负面的事情。

恋爱、课外活动、游戏等与学习无关的活动,对于孩子的成长到底有多大的帮助?以往我们总是停留在定性和经验上,而没有真正的进行定量分析。

另一个案例是成都七中的,我们在成都七中做了很长时间的课堂试验。一个班60个孩子,每个孩子的桌子上都有一台平板电脑,老师出一道题后,学生在规定时间内用平板电脑进行解答。老师可以及时的观察学生的答题正确情况,根绝错误的多少对习题选择性的进行解答。老师甚至可以针对性的给学生布置作业,差异化的强化学生的薄弱环节。

我们教育最大的问题就是,聪明的学生总是在随大流浪费时间,但跟不上的学生却永远都跟不上。只有针对性的处理,才能有更好的结果。

总体来说,我们如果想预测一个学生的成绩,我们有三大类数据:第一个是你过往的成绩;第二是看图书馆数据。进出入图书馆多少次、待多长时间、借书多少书等;第三种就是自律性。生活起居、吃早餐的时间等。

通过这些,我们就能够预测出学生期末的期末挂科情况,并予以介入和帮助。

大数据助力金融

中国在从一个大国向强国变化的过程中,只能走科技创新的道路。但科技型的中小企业,比如新能源题材的,在面对的市场往往方向不够清晰。

很多中小型的科技企业,很难准确找到对应的市场,也不知道产品形态,销售渠道和竞争对手是谁。这导致他们需要花很长时间教育市场。高科技的企业还需要大量的投入,在产品尚未出炉之时,企业会有一两年的沉默期。这些问题都需要我们用金融的手段来解决。

债权是金融中最重的融资手段,但是银行又不倾向于给中小企业进行债权贷款。毕竟,小微企业的坏账率在10%左右。因为这些企业抗风险能力较差,而且银行普遍认为他们没有抵押物。

所以我们做了一件事情,就是为这些科技型企业、创业企业和小微企业,建立丰富的数据模型,预测他们的风险情况。

政府在这里可以做三件事,一是开放一些核心数据,二是进行一定的贴息。三是设立一个基金池,给贷款的银行进行一定的风险担保。

为什么我们能够做?原因是我们一般使用大量的行为数据。因为企业和人一样,都是在不断的成长的。以锤子科技为例,这笔投资亏损了近8个多亿。实际上,锤子科技北京总部早就停止招聘员工了,但成都的投资方这边不知情,最后导致了判断的失误。

再比如法律诉讼,大家比较容易想到的是裁判文书。我们对很多仲裁法院进行了爬虫抓取。因为一旦开庭,不管是仲裁还是政府,都会有开庭公告。虽然我们不一定知道相关细节,但这也是衡量企业一个非常重要的权重。

我们还会看一家企业在各大招聘网站上的指标。有多少个职位挂了出来,这些职位有多少人,招聘周期有多长等等。这样,我们就可以看出这个企业是在收缩还是在扩张。我们还能看到工商注册信息,所有的股东,董事长和监事的外部关系。

还可以看到企业在国家公共信用平台的处罚信息,包括食药监、安监、环保和行政等各个平台。这些信息是动态的,而且能快速对企业进行评价。

如果政府能够更加开放,比如重庆、贵州和上海等地方。类似于税务、社保和水电等数据被开发出来,它就会带来更大的价值。通过这些公共工具,真正能够很清楚的知道企业的情况。

这是我今天全部的分享,谢谢大家!

信息化和软件服务网 - 助力数字中国建设 | 责编:莎莉