找歌词就来最浮云

《听众问答:38 答人工智能预测世界杯的技术原理》歌词

所属专辑: 科学有故事 歌手: 科学大求真 时长: 16:48
听众问答:38 答人工智能预测世界杯的技术原理

[00:00:00] 本字幕由腾讯音乐天琴实验室独家AI字幕技术生成

[00:00:03] 听众问答

[00:00:05] 好这段时间呢

[00:00:06] 又是四年一度的火热世界杯了

[00:00:09] 那就有很多听众啊

[00:00:10] 来问我是不是球迷看不看球

[00:00:12] 怎样才能科学地购买足球彩票

[00:00:15] 还有人听说今年是人工智能预测世界杯的元年

[00:00:19] 问我怎么看

[00:00:20] 还有很多围绕世界杯的问题

[00:00:22] 那我今天呢就来蹭一个热点

[00:00:24] 简单的聊一下世界杯吧

[00:00:26] 我听说呢

[00:00:27] 有很多人为了看球把工作都辞掉了

[00:00:30] 等世界杯结束以后啊

[00:00:31] 再去找工作

[00:00:32] 我觉得这种啊

[00:00:33] 才叫真球迷

[00:00:34] 不知道我的听众当中啊

[00:00:36] 有没有这样的真球迷

[00:00:37] 那我呢

[00:00:38] 可能连伪球迷都算不上

[00:00:40] 我只会在淘汰赛开始后呢

[00:00:42] 看完整的比赛

[00:00:43] 但如果遇到后半夜才开始的话我也基本上是熬不住的睡觉优先

[00:00:47] 所以呢

[00:00:48] 对于足球啊

[00:00:49] 我肯定算是一个外行

[00:00:51] 因此呢

[00:00:51] 本期节目的重点呢

[00:00:53] 是与足球本身无关的

[00:00:54] 我只是借着足球的这个话题来跟大家简单介绍一下人工智能预测世界杯的技术原理到底是什么

[00:01:03] 但是为了能够在举例子的过程中啊

[00:01:06] 不至于显得完全不懂足球

[00:01:08] 我呢

[00:01:08] 找到了我的一位很内行的老听众比尔先生

[00:01:13] 哈喽

[00:01:13] 大家好

[00:01:14] 我是科学有故事的听众

[00:01:16] 比尔阿汪老师的节目

[00:01:19] 我是从仰望星空开始听的

[00:01:21] 我非常喜欢这个专辑

[00:01:23] 然后他的付费专辑

[00:01:26] 每一期我都有买hello

[00:01:28] 我先介绍一下我自己啊

[00:01:29] 我是2014 年入行做足球分析节目的现在是腾讯签约的一当足球数据分析节目的一个栏目组啊

[00:01:39] 我也曾经制作过20 0多期的足球分析数据分析的一些视频在过去的比赛分析里面201 6年的欧洲杯

[00:01:49] 还有20 18 年的欧冠杯

[00:01:52] 这两个大赛

[00:01:54] 我仅仅是失误了4 .5 场

[00:01:57] 现在呢

[00:01:58] 我是主攻真实球场数据

[00:02:01] 这个方面去做比赛分析的我也是秉持着科学的精神去做我的节目

[00:02:09] 如果大家有兴趣的话

[00:02:10] 可以关注一下我的公众号比尔足球比尔是比尔盖茨的比尔好这个先谢谢比尔有了他在我边上随时解答我的一些问题呢

[00:02:21] 我心里就有底多了

[00:02:23] 不至于闹出一些笑话

[00:02:25] 2018 年的5 月17 日

[00:02:27] 全世界著名的投资银行

[00:02:28] 瑞银利用大数据和人工智能技术发布了一份预测报告结论是

[00:02:34] 德国夺冠的概率是24%

[00:02:37] 其次呢是巴西1 9.8 %西班牙1 6.1 %英格兰8 .5 %那至于这个预测的准确性到底如何啊

[00:02:46] 我们再过几天就知道了

[00:02:49] 其实呢预测比赛胜负的软件历史呢

[00:02:52] 是非常悠久的

[00:02:53] 可以说从计算机诞生开始博彩公司就会利用计算机编写预测软件辅助分析

[00:02:59] 但为什么现在啊

[00:03:01] 却要说是人工智能预测

[00:03:04] 好像是新诞生了一个什么了不起的新鲜事物

[00:03:07] 那很多人呢

[00:03:08] 可能认为啊

[00:03:08] 这只不过是宣传的一个噱头而已

[00:03:11] 并没有什么本质上的区别

[00:03:13] 没有那么简单

[00:03:14] 这确实啊

[00:03:15] 是一个新事物人工智能预测和过去的电脑预测确实啊

[00:03:20] 有一些根本性的区别

[00:03:23] 过去我们编写一个足球预测软件

[00:03:25] 我们需要请像比尔这样的分析师来仔细分析影响比赛胜负的因素有哪些

[00:03:32] 这些因素对胜负的影响的权重又是些什么

[00:03:36] 例如阿比尔告诉我影响一场比赛的数据有很多类型按照重要程度区分档次的话

[00:03:45] 我会分为四档档次越高的数据对比赛的影响就越大

[00:03:51] 先说S 级S 级里面有商品有阵容的完整性

[00:03:58] 中场核心的实力中场核心的状态最后一个是配合中场球员的人员的多少

[00:04:08] 这里面我老是提到中场核心是为什么呢

[00:04:13] 就是因为中场核心会是中中场或者前腰或者后腰

[00:04:18] 他们在每一个队伍呢

[00:04:20] 都是攻击或者防守的起点

[00:04:24] 要是这个起点出了差错

[00:04:26] 后面就会影响流畅性

[00:04:29] 如果中长本身出现问题了

[00:04:32] 那后面的一环扣一环的战术逻辑就不攻自破

[00:04:38] 就不能执行下去了

[00:04:40] 至于a 级影响可能就小一点

[00:04:44] 球队的风格教练的经验球队得分方案的多少球队防守球员的默契如何等等就属于a 类

[00:04:56] Be 类的话

[00:04:57] 球员的休整时间球员的锻炼机会

[00:05:01] 球员的大赛经验

[00:05:03] 年龄

[00:05:03] 个性等等都会影响这个比赛

[00:05:07] 但就不是非常重要

[00:05:09] 到了C 级很多人一直在说的啊

[00:05:13] 气候纬度时差这东西还有球员的这个精神面貌

[00:05:20] 你看啊

[00:05:20] 这些知识过去的电脑呢

[00:05:22] 是不可能拥有的

[00:05:24] 因为电脑哪里懂足球呢

[00:05:25] 他只能依赖于人编写的一个数学模型

[00:05:28] 由人来创建一套计算胜负的算法

[00:05:31] 说白了在传统的预测软件中计算机只是起到了一个计算器的作用

[00:05:38] 如果你精通Excel 的制作

[00:05:40] 再加上一个比尔的话

[00:05:42] 你们俩就能完成一个还不错的预测世界杯胜负的电子表格

[00:05:46] 但是到了人工智能时代

[00:05:48] 一个精通人工智能程序编写的程序猿

[00:05:51] 他就可以不再需要一个像比尔这样的懂足球的分析师就能做预测软件了

[00:05:57] 他怎么做呢

[00:05:59] 靠的就是机器学习

[00:06:01] 今天我们所谓的人工智能它的本质呢

[00:06:04] 其实就是机器学习

[00:06:07] 好假设我现在呢

[00:06:08] 就是这个程序猿

[00:06:10] 那我根本就不需要知道刚才比尔讲的那些因素啊

[00:06:13] 到底哪些重要哪些不重要

[00:06:15] 我只需要随便猜测

[00:06:17] 有可能影响比赛结果的因素到底有哪些就可以了

[00:06:21] 哪怕初听上去似乎啊是八竿子打不着的因素

[00:06:24] 我也可以列进去

[00:06:25] 比如说球员有没有孩子下一步呢

[00:06:28] 我就是收集过去几十年中

[00:06:31] 所有参与世界杯比赛的球队的各种数据

[00:06:35] 只要是含有我怀疑与比赛胜负有关的数据就可以越多越好

[00:06:40] 那再下一步呢

[00:06:41] 我就利用一种叫做深度学习的计算机算法

[00:06:45] 让计算机自己去分析这些因素与比赛胜负的关系

[00:06:50] 你可能一下子没有理解这是怎么做到的

[00:06:52] 我给你举一个最简单的例子啊

[00:06:54] 比如说计算机统计了过去世界杯所有比赛的数据发现球员平均年龄越接近3 0岁胜率就越高

[00:07:03] 注意啊

[00:07:04] 我这是打个比方啊

[00:07:05] 不是说真的是这样子的啊

[00:07:07] 那么当我要预测一场比赛的胜负的时候

[00:07:10] 那我就统计一下比赛双方球员的平均年龄然后啊

[00:07:14] 我就预测更接近3 0岁的那个队伍获胜

[00:07:17] 虽然我完全不知道这是为什么

[00:07:20] 但是过去的统计数据的结果啊

[00:07:21] 他就是这样的那至于到底是什么原因我或者说计算机根本就不需要去管也不需要去知道现在呢

[00:07:29] 这样的深度学习算法都是现成的最流行的机器学习的编程语言啊

[00:07:34] 是python

[00:07:35] 你可以很容易在网上下载别人已经封装好的程序库

[00:07:40] 那这些程序库啊

[00:07:40] 就像是一个黑盒

[00:07:42] 你只需要使用几条简单的程序语句给这个黑和输入数据指定一些参数

[00:07:48] 那这个黑河呢

[00:07:49] 就能输出他从这些数据中分析出来的

[00:07:53] 你指定的那些关键词的相关律

[00:07:55] 而且啊你还可以不断的让机器自我学习迭代

[00:07:59] 比如你创建好了

[00:08:01] 世界杯预测1 .0 的程序

[00:08:03] 当世界杯开始以后啊

[00:08:05] 你就让他根据自己的预测不断的与实际比赛结果比较

[00:08:09] 如果预测准确呢

[00:08:11] 就好像是下围棋获得了胜利预测不准确啊

[00:08:14] 就是失败机器就可以根据胜负的情况

[00:08:17] 不断的重新调整自己的算法

[00:08:20] 现在阿法狗的升级版就是通过自己和自己下围棋来不断的调整自己的算法

[00:08:26] 他的道理呢

[00:08:27] 是相通的过去啊

[00:08:28] 我们总觉得没有会下棋的人参与怎么能编写下棋软件呢

[00:08:33] 没有精通中英文的人参与怎么能写出翻译软件呢

[00:08:37] 那么在大数据和机器学习时代真的就不需要了计算机只关心统计结果不关心他们的因果关系

[00:08:45] 从这个例子中啊

[00:08:46] 我们可以得出这样两个结论

[00:08:48] 第一人工智能依赖已知的数据工作你喂给它的数据越多

[00:08:54] 它就可以预测的越准确

[00:08:56] 反之啊他如果吃不到数据

[00:08:58] 它就无法工作

[00:08:59] 第二人工智能本质上只是一种数学统计模型的具体应用本质上呢

[00:09:05] 还是一个计算器

[00:09:07] 只是计算公式超级复杂运算速度超快而已

[00:09:10] 计算机并没有思考他并不真正的懂足球

[00:09:14] 他甚至啊

[00:09:15] 完全不知道他是在预测足球赛

[00:09:17] 他唯一知道的只是在不断的调整一些关键词与另一些关键词之间的统计相关性

[00:09:25] 因此呢

[00:09:25] 对于预测世界杯来说真正困难的是找到足够多的有效的数据为给你的程序吃你喂给机器学习程序的数据越多越真实

[00:09:36] 他从中总结出来的规律也就越准确

[00:09:39] 或许讲到这里呢

[00:09:40] 你就能理解了

[00:09:41] 为什么现在我们总是听到有人在说数据比技术值钱

[00:09:45] 关于这一点呢

[00:09:46] 我们也可以听一下比尔是怎么说的

[00:09:49] 所有的人工智能现在为止都只能是有数据的基础上去做的

[00:09:56] 而且通俗点来讲

[00:09:58] 这个数据的来源非常重要

[00:10:01] 要经过筛选

[00:10:03] 而且现在网络上关于足球的数据

[00:10:07] 可以说是漫天盖地

[00:10:09] 大家对于数据这个东西其实有误解的

[00:10:13] 并不是说数字才是数据

[00:10:16] 现在的数据很复杂

[00:10:19] 有数字有图像

[00:10:22] 对吧

[00:10:22] 也有声音

[00:10:24] 只要是你可以量化的一些东西就称为数据可以表达的一些东西

[00:10:31] 也可已成为数据

[00:10:34] 好了

[00:10:35] 当你理解了所谓的人工智能预测世界杯的技术原理

[00:10:38] 你也就能发现这种预测方法的局限性了

[00:10:42] 那就是啊

[00:10:42] 他无法处理以前从来没有出现过的数据

[00:10:46] 比如说这次世界杯法国对阵澳大利亚在世界杯历史上就第一次通过录像回放判罚了一个点球

[00:10:54] 那这个叫做VR 的新规则就是一个过去从未出现过的会对胜负产生影响的因素

[00:11:01] 那这个因素所有的人工智能程序

[00:11:03] 就根本处理不了

[00:11:05] 因为啊

[00:11:06] 根本没有过去的数据做参考

[00:11:08] 本期节目啊

[00:11:09] 我还给大家找了一个牛津大学的介绍什么是机器学习的小视频

[00:11:14] 他举了一个例子就是机器啊

[00:11:16] 如何区分一张照片里的是猫还是狗

[00:11:19] 如果你对他有兴趣的话呢

[00:11:21] 可以在我的微信公众号科学有故事中回复机器学习四个字

[00:11:26] 就可以收看了

[00:11:27] 好关于人工智能预测世界杯的话题呢

[00:11:30] 我就浅尝辄止就谈到这里最后呢

[00:11:33] 我再给大家放一些我跟比尔的谈话录音或许呢

[00:11:36] 球迷朋友会感兴趣

[00:11:37] 如果是非球迷的话

[00:11:38] 你们不听也无所谓啊啊

[00:11:40] 不过为了节约大家的时间啊

[00:11:42] 我把这个比尔先生的发言呢

[00:11:44] 用技术手段加快了1.5倍

[00:11:56] 比尔前两天有一场爆冷的比赛就是德国队赋予了墨西哥队

[00:12:01] 那我想问一下这种爆冷的结果会不会让博彩公司赔钱呢

[00:12:05] 爆冷这个东西

[00:12:06] 其实大家觉得博彩公司会赔钱是很傻很天真的爆冷市值很低概率发生的事情

[00:12:11] 通常这些低概率的事情会有一个很好的回报

[00:12:15] 也就是说这个叫爆冷的赔率的博彩的赔率是一个可以变动的服务点

[00:12:20] 会随着这个投注量的变化而变化

[00:12:22] 所以他们会按照投入量还有赔率做出一个实时的平衡的方案

[00:12:27] 这需要用到计算机的这个技术尽管不一定会绝对的平衡

[00:12:31] 但是他可以保证这个公司不会亏钱

[00:12:33] 不过这个大家可以想象的

[00:12:34] 但是有一点大家可能不知道的就是一直有一些人会误导大家说呃

[00:12:39] 人家这个平衡的方案是按照这个胜平负的投注量去设计出来的

[00:12:44] 这是错的

[00:12:45] 因为在这个赌局里面博彩公司不但要平衡胜平负还要平衡

[00:12:49] 诸如很多

[00:12:50] 刚才所说的什么进球数啊

[00:12:51] 比分啊红黄牌啊

[00:12:53] 等等等等

[00:12:54] 越多的盘口

[00:12:55] 对于博彩公司平衡一场比赛的盈亏就越有利

[00:12:58] 还有这还不算哈

[00:13:00] 一天里面有多少场同时结算的一个比赛呢

[00:13:04] 很多很多

[00:13:04] 而且这些东西又不是说立刻就可以提现的这个有一个结算周期通常是一天之后才行

[00:13:10] 如果像是你在中国买了彩票

[00:13:12] 然后到这个竞彩中心去领奖

[00:13:15] 这个过程

[00:13:15] 其实这个结算周期就更长了

[00:13:17] 所以这博彩公司是一个极为庞大的吸金的大黑洞

[00:13:22] 所以那天如果他爆冷的一场比赛对于他来说真的就是挠痒痒应在博彩公司更多的运营成本在于宣传

[00:13:28] 还有政策沟通

[00:13:29] 这方面啊这些就不做讨论了再补充一个点就是大的博彩公司一般都要一天小的博彩公司真的有可能会亏钱

[00:13:36] 但是人家小的博彩公司也可以采取一些非法的手段诸如后台篡改这个投注的数据导致到用户不赢反输货

[00:13:44] 或者说让你的投注无效

[00:13:46] 这些都是很可恨的

[00:13:47] 而且无根可寻你告不了她

[00:13:49] 所以我还是建议大家去合法的一个投注站哈去买彩票

[00:13:52] 这些都是有票据的

[00:13:53] 所以现在为什么网上有很多通告说要整顿这些购彩的APP 呢

[00:13:57] 原因就是很多的渠道都是灰色的

[00:14:00] 比如说你购彩了你不知道在哪一家彩票店出的票

[00:14:03] 还有后台资金的准确性和安全性提现的一个手续是不是合法的

[00:14:08] 如果以上所说有任何一个不合法

[00:14:10] 那你这个购票的行为可能都是非法的

[00:14:12] 可能都不受法律保护

[00:14:14] 举个例子吧

[00:14:15] 这些公司你们要是在里面有资金

[00:14:17] 万一有一天他被查处了

[00:14:19] 他被封号了

[00:14:20] 那它受到了法律的制裁

[00:14:22] 但是没人没人会理你账号里面有多少钱立马就被封了

[00:14:26] 难道你还去报警啊

[00:14:28] 也就是说呢

[00:14:29] 比尔先生提醒我们

[00:14:30] 不要去玩那种非法的赌球

[00:14:32] 如果要买世界杯的足彩呢

[00:14:34] 不是不可以

[00:14:35] 但是呢

[00:14:36] 请通过合法的途径去购买

[00:14:39] 不过比尔我好像听说呢

[00:14:40] 有些博彩公司啊

[00:14:42] 他反倒是喜欢爆冷为什么会这样

[00:14:45] 如果硬要这么问的话

[00:14:46] 我觉得博彩公司还是会偏向于想爆冷的

[00:14:49] 因为博彩公司在平衡做这个系统平衡性的时候出现不同的赛果还是会影响它的盈利的

[00:14:55] 只不过他盈利多还是少的区别

[00:14:57] 但按照一个企业最终也希望他的利润最大化的时候

[00:15:00] 他还是想爆冷的

[00:15:01] 只不过实际意义上的爆冷

[00:15:04] 跟大家平时听到的爆冷可能就不一样了

[00:15:07] 大家都是通过媒体宣称的是爆冷这么一回事就觉得是爆冷

[00:15:11] 比如说德国这场比赛我们在分析的时候就已经判断到了德国的中场有很大的问题

[00:15:16] 按照伤病还有中场的状态来说

[00:15:19] 德国会出现平局甚至输球的概率都会很大

[00:15:22] 所以德国那天的比赛在专业的数据分析上面其实并不能称做为爆冷

[00:15:28] 比如这届世界杯了很多标题党就会传播巴西夺冠啊

[00:15:31] 英格兰已经没落这些消息普通人看了就会愿意相信他们自己写详细的部分

[00:15:36] 特别是一些阴谋论的一些软文啊

[00:15:39] 充斥着这个网络

[00:15:39] 所以这手段呢

[00:15:40] 给大家爆料一下哈就是嗯

[00:15:42] 博彩公司呢

[00:15:43] 会有很多自己的一个合作网站

[00:15:45] 而且这些网站呢

[00:15:46] 都会伪装

[00:15:47] 成为数据网站

[00:15:48] 比如说有个叫school 的公司

[00:15:50] 就是跟365 再合作

[00:15:51]

[00:15:52] 实际上呢

[00:15:53] 这个公司他是不产生数据的

[00:15:55] 他们的一些数据是要去到另外的数据公司去买接口

[00:15:59] 然后自己拿回来用

[00:16:01] 例如说op 就是它的一个数据的提供商

[00:16:03] 然后拿到数据以后呢

[00:16:04] 他们会安排自己的软件工程师做二次的开发

[00:16:07] 最终变成了一种图文并茂的数据给用户去看给用户去分析你要说这些数据的真实性啊

[00:16:14] 还并不是用户可以自己参透的

[00:16:17] 这个看来每一行啊

[00:16:18] 都有很深的水

[00:16:19] 那谢谢比尔能够参与我们的节目

[00:16:22] 如果大家喜欢足球喜欢世界杯

[00:16:24] 那你可以关注一下我的公众号比尔足球比尔是比尔盖茨

[00:16:28] 比尔好的最后一句话

[00:16:30] 大家听清楚了吗

[00:16:31] 喜欢足球的朋友可以去关注一下比尔足球啊

[00:16:34] 好那这就是本期的听众问答

[00:16:36] 咱们下期再见

[00:16:47]

随机推荐歌词: