本字幕由酷狗AI生成
原来的样子
原来是这样
欢迎来到原来是这样
各位好
我是徐东
没错
这一期只有我一个人陪着大家
至于原因节目后再说
虽然说咱们是通过声音联系在一起的
而我所传播的内容也是通过听觉为你们所获取
但是抛开这些的话
如果说你的视力健全呢
不得不承认我们从外界接收的8 0%以上的信息呢
都是通过视觉来获得的
所以要说人类最重要的感受器官是什么
眼睛一点不为过
我记得很早的时候咱们就聊过眼睛和视觉甚至植物的视觉或者叫光感觉也和大家叨过
而今天呢
我们又想从另一个角度和大家来聊聊视觉这件事儿
当然这次要说的并不是生物的视觉
而是另一个正在迅速崛起的智能人工智能他们的视觉到底是怎么一回事儿
说不定啊
通过这期节目也可以帮助各位来想象一下AI 眼里的世界
他究竟是怎样
首先
想象一下
有一个人朝你扔过来一个球
这个时候你会怎么办呢
当然是马上把它接住这看上去呢
是一个再简单不过的本能
但实际上这一过程是最复杂的处理过程之一怎么说呢
大致过程是这样的
首先求反射的光线会进入到我们的视网膜经过一番元素分析之后发送到大脑视觉皮层呢
会更加彻底的去分析图像
把它发送到剩余的皮质与已知的任何物体相比较
然后进行物体和纬度的归类
最终呢会决定你下一步的行动
比如说举起双手拿起球而在这之前呢
其实我们还通过了一系列复杂的机制预测了他的行进轨迹
刚才我所描述的这个过程呢
我花了差不多一分钟的时间还只是说了一个大概
但是对于我们而言
整个过程
其实只需要零点几秒就可以完成
可以说它几乎是一个完全下意识的行为不需要经过什么思考
而如果你的协调能力
还算不错的话
这当中还很少会出差错
事实上啊
对于这背后的一套机制
脑科学家呢
仍然还处在理解它的阶段
而真正要在计算机或者是在AI 上重塑它路呢
还非常的漫长
这是因为要重塑人类的视觉
它不仅仅是单一的一个困难的课题
而是一系列环环相扣的过程
这个问题的研究呢
如今已经发展成了一个专门的学科就叫计算机视觉
Computer version 而至于为什么不叫AI 视觉所谓的artificial intelligence division
那其实既关乎于目前我们还没有对人工智能有一个特别明确且严格的定义也源于当前人工智能的本质呢
还是用零和一进行计算的机器
因此呢
他并没有脱离计算机的范畴
而今天我们所讲的视觉背后呢
更没有控制理论机械理论在里边
因此呢
更妥妥的就是计算机视觉了
事实上
计算机视觉的理论研究应用到人工智能领域
它是非常普遍的
可以说计算机视觉的进展
决定了人工智能它到底能够看到什么
早在1966 年人工智能领域的先锋派人士Marvin minsky 就曾经给自己的研究生出过这样一道题他呢
要求研究生把摄像机连到一台电脑上让他描述自己看到了什么
谁会想到50 多年后
我们仍然在研究相同的课题
所以啊
计算机视觉这门学科
实际上他依然非常的年轻
因为它存在的前提呢
是我们必须要达到相对较高的计算机发展它的发展需要依托于计算机的强大运算速率打个比方
如果关于计算机视觉的研究是一本剑诀那么计算机的发展运算水平就相当于握在手里的剑
谈到计算机视觉这门学科呢
就不得不提到上世纪70 年代中期MIT 人工智能实验室里工作的一位年轻人的名字
David mark
这个mark 他出生在英国
原来研究的领域呢
是人脑他在剑桥大学拿到了数学硕士神经生理学博士
而主要研究的则是人的脑神经结构
同时呢
他还在心理学生物化学等方面有涉猎有没有发现从他的教育背景当中
除了剑桥的数学硕士之外
似乎看不出和计算机的关系
但这一点也不矛盾
你想要让计算机代替我们的视觉去工作
我们是不是首先就得了解我们的视觉是什么
以及我们要计算些什么
对不对
猫很聪明
他把自己对神经科学的研究放到计算机人工智能领域
于是呢就结合成了一个跨学科的产物
他当时就提出啊
视觉计算机理论把我们的视觉划分成了表达算法和实现这三个层次
简单来说呢
表达就是用什么东西他其实呢是相当于为我们建立了一个标杆
我们要测量什么建立什么模型用什么物理硬件来实现
其次呢猫儿他还厘清了我们到底要计算些什么
比如说物体的纹理立体视觉运动分析
表面形状等等
努力的为这一问题
建立一个完整的科学体系
忽然想到这或许也是咱们原来是这样一直想给各位传达的
不要把自己框定在某一学科当中学科之间呢
它是可以相互跨越的
而且这种跨越非常的重要
熟悉的知识运用在不同的领域
它本身就是一种创新的重要思路马儿呢
是这一领域无可争议的奠基人
国际计算机视觉大会
也就是ICC 委员会呢
是专门以他的名字设立了马尔奖这一奖项呢
被看做是计算机视觉研究方面的最高荣誉之一
当然这里还要再说一句啊
马尔在1972 年拿到了剑桥的博士
而在1978 年非常不幸被诊断出了白血病1980 年
他刚刚转为正教授不久就去世了
时年只有35 岁
真的是英年早逝
十分的可惜
所以呢
即使到他逝世的时候
我们依旧可以称他为年轻人向他致敬
当然啦
寂寞二之后还有一大批杰出的科学家前赴后继地投入到了计算机视觉这个领域当中原因很简单
正如视觉对于我们人类认知这个世界是如此的重要一样
如果要让计算机产生智能呢
教会他看想必也是同样重要的一件事儿
80 年代中期以后呢
就不断的有新理论提出而直到今天
它依然是一个科学研究的热点
简单的来说啊
计算机视觉呢
就是用计算机来模拟人的视觉过程来代替人类完成一些工作
比如说无人驾驶汽车这个例子
咱们要实现这样一辆汽车就得首先保证它能够应对复杂多变的道路
他看到行人要避让
要按照道路上的线来走
不能随意的变道而遇到红灯还得停
其实呢
这都需要他能够看清道路要能够看见周围的一切
这就需要计算机视觉的辅助了
当然
如果说要真正理解人工智能看的问题
实际上呢
我们还得分成三个阶段
看到看懂以及真正的像人一样去看
而这其实就涉及了计算机视觉正在走的三个方向
复制人眼复制视觉皮层以及复制人类大脑剩余的部分
这三者可不是简单的并列关系
如果说要给彼此之间打上难度系数的话
每一个阶段的难度系数都差了好几个数量级
先拿比较容易去理解的
怎么看到河怎么看懂这两个问题来说啊这两者呢
是两个完全不同的问题还是拿我们人类来做比较
怎么看呢
这是眼睛负责的问题
光线到达我们的晶状体通过睫状肌的调节外界光线在视网膜上成像感光细胞呢
就负责把光线信息通过神经传递到大脑
这是我们人类怎么看的问题
而至于详细的情形呢
大家也可以出门左转回听一下关于眼睛的那几期节目
而怎么看懂
这就涉及到了大脑的问题
比如说我看到了一棵树一眼就能够在脑子里描绘出它的大概形状吧
稍稍仔细一点也不用多想我们就能够分辨出这是一棵松树还是一棵樟树
而如果看一眼你旁边的人
比如说在未来的某一次见面会上
你见到了我
然后呢
你对我展露出了笑容
这背后
实际上就意味着你能够理解你看到的东西对于你来说的意义
并同时做出相应的反馈
这就意味着你
看懂了
那至于要让计算机真正的像人一样去看
这其实就更加复杂了
因为它还包含了整个认知过程的问题
比如说我们为什么要看我们选择看些什么
看到的这个和看到的另一个他到底有怎样的关联等等
不着急
咱们一点一点来
先说最浅层次的啊
就是让计算机看到
我们对于外界的了解呢
离不开眼睛
耳朵
舌头
鼻子皮肤这些感受器官
其实对于机器也一样
要让机器有所谓的感觉
那我们首先就得把外界的信息
比如说声音又比如图像又比如触碰的压力等等传递到机器里
让他们有感觉
像这一类感受外界信息的东西呢
我们叫他传感器传感器它的本质其实是将一种信号转换为另一种信号的转换器
比如说我们需要的人造眼睛就是把外界的光信号转化为电信号的一种传感器
相信你一定想到了啊
所谓计算机的眼睛
这无外乎就是我们现在所使用的数码相机或者是数码摄像头呢
我们也不妨花一点时间来了解一下它究竟是如何实现的这里呢
可以说一点挺有意思的原理上的东西
要明白计算机它是如何看到的这里呢
得再展开讲两个概念一个呢叫灰度级一个呢叫数字化
首先呢我们来说一说灰度级啊
我们知道光的本质呢
是一种电磁辐射
它有波长同时呢也携带一份份的能量
每一个光子它都带有能量不同波长呢
也就是不同频率的光组成的色彩斑斓的可见光光谱段和我们看不见的不可见光谱段
比如紫外线
又比如红外线
而当一束光的各个波长段的可见光的能量都相对平衡
使咱们人眼看到的就是白色
当然也有些人会把它称为无色光
这里应该有些朋友还记得曾经提到的三原色的概念啊
所以我们可以理解为当红绿蓝的分量都一样的时候混合发出的光呢
就是所谓的无色光
当然叫他白光更通俗一些
而灰度级呢
指的就是这种白光的能量强度
灰度图就是由单纯白光构成的图像
别以为光是白光构成的图像
它就没有办法传递信息了
回想一下黑白照片
黑白电影
我们依然是能够非常轻松地分辨它背后的信息
而这种信息呢
他就是经由明暗的区别
或者说的更学究一点说的是光的能量
又或是灰度级的不同而展现出来的
在摄像头里呢
就有一种感光材料
当光线照射到这种感光材料表面的时候
由于光电效应会产生电子逃离原子核儿不同能量的光打在感光材料上会造成电子逃逸的多少
从而呢就造成了电势能的变化
因此利用这种材料我们就可以把白光的强度信号转化为电压信号
至于光电效应是什么
大家不妨出门左转去回听年初的那个靓字系列
当我们感受彩色光的时候不像白光那样只有强度这一个信息
我们用发光强度光通量和亮度来衡量
因为我们知道当射进去的光的频率小于特定频率的时候光电效应无法发生
因此啊
其实光本身的能量并不等于我们实际上能接收到的能量
所以呢表现出来的光强度上会有所差别
现在我们的相机用的感光材料呢
一种叫CCD
也就是电荷耦合元件一种呢
叫做cmos 也叫互补
金属氧化物半导体
但是他们的本质是一样的
只是转化为电信号的方式有所不同
刚才说的就是数码相机的原理了
只要我们把外界的光聚集打在这些感光材料上通过测量每个点的电压就可以知道这一部分的灰度级是多少
从而最终拼凑出一整幅图像
那我们要测量多少个点的电压呢
当然我们不可能把一块材料上的所有的点都测一遍
以现有的技术
这是几乎不可能实现的
所以这里就涉及到了第二个概念
那就是数字化
其实数字化在这里呢
还有两个含义
第一呢
是咱们取样的数字化意思呢
就是我们只能测量有限个点的电压
我们用在这一个点测得的能量值来代表附近
周围一小片区域的能量值这一小片区域就成了属性一样能量均匀分布的单位区域
而在这里呢
我们也叫它像素点
第二个含义呢
是量化的数字化
意思是我们要用一级级的值来表示光的灰度级
比如说从一到256 来表示
那么这个像素点内光的强度是多少呢
我们就不能说是比如188 .6 可以用四舍五入的方法认为他是189
如果说你是一个听到数字就头晕的人也没有关系啊
听到这儿呢
只需要明白一点
那就是电脑里存的他都是数字
而且呢是被我们抽样得来的数字是被约等于的数字
正因为我们采集的信息不完全所以我们拍出来的照片永远都不可能和真实图像一模一样
当然了
也不要觉得咱们的眼睛高明多少
其实我们能获取的视觉信息
永远也只是真实的一个片面的投影罢了
这个说的有点远啊
说回来
在大自然里现实生活当中连续不断的量
比如说光的能量空间中的坐标
我们叫他模拟量
而在我们的电脑里那种有明显的层级
而且不可能无限大的量呢
我们称之为是数字量
当然你肯定会想啊
光有明暗好像还不够
就好比红绿灯
这种非常基本的信号
它就是通过不同的色彩来传递信息的吗
那么彩色照相机的原理到底是什么呢
说起来其实也不复杂
我们只需要记录下每一个像素点对应的红光绿光蓝光分量
到时候再补充同样亮的光回去就可以了
实际上呢
我们采用一种滤镜来对每一小片感光材料区域内进行光的色散
从而记录下每一小片区域的三色光分量值
这一点从原理上呢
和我们拥有的分别对红绿蓝三种波长光线特别敏感的三种视锥细胞不太一样
当然
最终实现的效果是差不多的
让计算机能够看到这也是计算机视觉
目前做出最多成效的领域
这就是所谓的复制人眼的确要通过强大的光学上更加完善的镜头以及纳米级别制造的半导体像素现代摄像机的精确性和敏锐度是已经达到了一个惊人的地步
在过去的几十年
科学家已经打造了传感器和图像处理器
这些甚至可以说某种程度上已经是对咱们的人眼实现了超越
可问题在于什么呢
虽然我们已经能够实现输出端极高的保真度
但是在很多方面来说
这些设备却又并不比19 世纪的那种针孔摄像机更为出色
他们充其量记录的只是相应方向上的光子分布
而即便最优秀的摄像头传感器
他也没有办法去识别一个球
更不用说把它抓住了
换而言之啊
在没有软件的基础上
硬件是相当受限制的这些高清的图片
如果不去处理它
就只是纯粹的信息而已
不能够被计算机去解读成一一
因此呢
在这一领域的软件才是需要投入解决的更加棘手的问题
这样说来成功对人眼完成模仿之后
我们就需要让计算机去看懂东西了
而要真正实现这一步啊难度呢
真的是高了好几个数量级
可以想象一下
通过我前面的介绍
如果你是一台计算机或者说你是一个人工智能经由咱们人类给你创造的所谓眼睛也就是摄像头
你看到的世界是怎样的呢
或许全都是数字吧
比如说我看到的山是山水是水儿在你眼里或许就是1234567
又或者是更加纯粹的01 01 0001 1
哪更准确的来说
在你眼里呈现出来的
其实是一个个由很多元素组成的大矩阵矩阵里面的每一个元素
它都是由零和一组成的数字
如果说你没有学过线性代数不知道矩阵是什么
那其实可以想象成是一个非常大的网格图
比如说一个720 乘576 的网格有720 行576 列
每一个小格子里面呢
都是数字
那如果是灰白图像呢
就只有一个数字
而彩色图像呢
则有三个数字
这就是所谓的RGB 分量
而作为AI 父母的人类呢
则要教会他怎样应付处理
甚至是理解
这里面对应的数字背后到底意味着什么
这听上去很难是不是因为机器毕竟不像人一样自然而然的就会思考而图像处理起来呢
可以非常的复杂
因此呢
计算机视觉技术也是人工智能
最难突破的领域之一
接下来呢
我就具体和大家来说一下目前我们是如何让AI 看懂东西的
我们还是得由浅入深地把它分成两个部分啊
第一部分呢
我们称之为数字图像处理技术
比如说我们的美图秀秀photoshop 这样的软件呢
都是这种技术下的产物
它的总体思路呢
就是通过编程来对图像进行处理
进而呢发展出了像是滤波去噪图像压缩图像重建与复原等等的实用技术
我们当然可以说这位AI 认识世界奠定了基础
而这门学科本身呢
其实也和数学密不可分
使用的比较多的是微积分
数理统计
与概率论线性代数等等
估计又有一听数学就头疼的朋友啦
我先打住
不过大家要明白的是之所以我们能够去享受这美好的现代生活
用上那么多方便的程序
这背后呢
其实都离不开数学的发展与支撑
收回来啊
似乎在我们的理解当中
如果我们想让一个机器听从咱们的指令
那我们就得要一步步的去告诉他第一步应该怎么做
第二步应该怎么做
因为他们实在是太笨了
比如说如果我们想要让一个机器人走路呢
我们就应该编程告诉他首先从双脚站立的姿态出发
把重心移到右脚
然后呢
把左脚放在前方的0 .3 米处
然后呢
再掂起右脚尖把重心慢慢的移到左脚
然后呢
把右脚也向前挪0 .3 米等等等等
似乎好像只有这样的笨办法计算机才能够听懂咱们的指令
然后呢
又笨拙的当然也不厌其烦的进行挪动
虽然这样的机器人
它永远不会像终结者里的天网一样
背叛人类
却也像一具没有感情不会思考的冷冰冰的机器
这和我们真正期盼的那种人工智能好像还差得非常非常的远呢
先前谈到的那些图像处理软件或者说图像处理程序大部分都还停留在这个阶段
脑洞太大
休息一下
如果听咱们的节目不过瘾
你也可以去我们的微信订阅号逛一逛啊与节目有关的更多知识干货
每周节目的BGM 歌单
还有趣味猜题闯关都在那里了微信订阅号搜索旭东刀科学叙事旭日的旭东是山东数这些刀是唠叨
其实吧你打旭东刀科学的拼音也是可以直接搜到的
而在数字图像处理技术之上
我们需要进一步去发展计算机视觉的话
就需要再次回到我们的眼睛以及我们的大脑是如何完成看这个过程了
我们的大脑从根本上就是通过意识来进行看的动作的比起其他的任务啊
在大脑当中相当多的部分
其实都是用来看的
而这一专程呢
又是由细胞本身来完成的
通过数以10亿计的细胞通力合作
在嘈杂不规则的视网膜信号当中去提取模式
如果在特定角度的一条沿线上出现了差异
或是在某个方向上出现了快速运动
那么神经元组就会兴奋起来较高级的网络啊
会将这些模式归纳进所谓的元模式当中
比如说我们看到的这个东西是一个朝上运动的圆环
与此同时呢
另外一个网络也会做出进一步的归纳
这是一个带红线的白色圆环
而且似乎在这背后还有一个模式体现在了大小上的增长
那么从这些粗糙
但是补充性的描述当中呢
具体的图像就生成了
我们也知道了图像背后的意义
使用人脑视觉区域相似的技术定位物体的边缘和其他特色
从而形成方向梯度直方图
由于这些网络一度被认为是深不可测的复杂
因此呢
在计算机视觉研究的早期采用的是别的方式也就是自上而下的推理模式
比如说一本书
看起来是这样
那么就要注意与这个类似的模式
又比如一辆车看起来是这样动起来又是那样
在某些受控的情况下
确实能够对少数几个物体完成这一过程
但是如果要描述身边的每一个物体包括所有的角度光照变化
运动和其他上百个要素
即使是刚刚会说话的小宝宝级别的识别
也需要难以想象的庞大数据
而且啊
在非常多
需要应用的地方光是编程这件事儿
他就实在是太庞大太复杂
又或许我们根本就没有办法知道到底是用什么样的程序才有可能实现
就比如以现有的技术而言
咱们就不可能写一个程序适用于机器人所遇到的所有情况吧
那么
在这种情况下
我们到底该怎么做呢
其实我们也不妨想一想看关于人工智能的所有启发都是在我们人类自己身上获得的
比如说我们模仿人类的眼睛发明了人工智能的眼睛前面说到的相机
人体本身呢
就是一个大机器人身上的信号是通过生物电信号来传递的人体内的膜电位差决定信号传送的关闭和开启这就相当于计算机里的零和一吗
可以说
人体本身的确有点儿类似于一台
当然更加精妙的计算机
那么如果模仿我们的大脑有没有可能创造出一个像人类一样的机器人呢
说的有点科幻
虽然说我个人相信未来终于有一天人真的有可能制造出真正意义上的人工智能
但大家也都知道现实又是非常残酷的人的大脑结构那么复杂
脑科学对人脑的探索
其实真的只是刚刚开始
现在的人类可以说自己都还没弄明白自己更何况要再造一个类似自己的东西
这里就要涉及到我们所说的第二部分
这就是当我们提到计算机视觉时
他实在绕不开的模式识别与机器学习了我们是不是可以不需要完美的复制人脑只要去模仿人类学习事物的过程
把这一属性赋予机器让他代替我们去学习
长此以往
他们就会变得比我们的某方面更聪明
不得不说
这是一种自下而上的方法计算机啊
他就可以在多张图中对一张图片进行一系列的转换
从而找到物体的边缘发现图片上的物体角度和运动就像人类的大脑一样
通过给计算机观看各种图形计算机呢
就会使用大量的计算和统计试着把看到的形状与在之前训练中识别的相匹配
这背后呢
其实就是海量的数学运算
他试图从这些数字当中寻找规律
没错
这就是大名鼎鼎的机器学习
那还是举一个计算机视觉里面非常著名的例子来简单的说一说啊
现在有些手机里边呢
有人脸识别人脸解锁的功能
当然也有很多朋友应该记得去年那场所谓的顶级人类站点大师和机器人比赛任务网红脸的大赛啊
这就说明现在机器的人脸识别水平呢
几乎已经是站在了人类的巅峰水平见了
而要做到人脸识别的第一步呢
就是完成人脸检测
所谓的人脸检测呢
就是我们要让计算机自己检测出人的脸来
我们呢
把人脸检测看做是一个复杂的分类识别问题意思呢
就是我们想要让计算机他自己就能够进行分类识别出这是人脸还是非人脸
如果说机器掌握了这种方法呢
我们就可以认为他懂得什么是人脸
虽然说他可能不知道人是一种什么样的生物
可是他已经能够认出具有人脸特征的大部分图案
那么问题来了我们怎么样才能够让机器认识这是一张人脸在这里呢
简单举一个有趣算法的例子
以便大家能够更加直观的理解
这种计算方法的名字呢
叫ad boost
它起源于valiant 提出的pac 可学习性这样子的一种理论思想
这个思想呢
是首先我们把来区分是不是人脸的机器叫做分类器
那么我们随意给这个分类器一个算法得到一个新分类器这个分类器呢
仅仅比我们之前随意猜测的要好一些
我们管它叫做弱分类器
那么我们就可以在这个基础上
根据几个弱分类器合成一个可信赖的强分类器
这个说的太学术了
打个比方
我们的第一个弱分类器呢
叫椭圆形的一大片区域就是人脸虽然有可能是灯笼第二个弱分类器呢
叫颜色光泽
接近于人脸肤色的区域就是人脸区域虽然呢
也可能是人的大腿
而第三个弱分类器呢
叫做中心有到三角形
三个黑点的就是人脸
虽然说这也可能会是一个树杈啊
或者说是一些其他什么样的东西
虽然说光听上去每一个弱分类器感觉都弱爆了
非常的滑稽
但是通过训练他
我们却有可能得到一个识别率很高的机器
听上去是不是有点三个臭皮匠顶个诸葛亮的意味
那具体怎么训练呢
首先呢
我们要收集很多图片作为训练集这里边呢
有些是正确的人脸有些呢
是假的人脸
然后呢
我们让这些弱分类器一起来进行识别算法本身呢
是改变数据分布实现它
根据每次训练集中的每个样本的分类是否正确
以及上次的总体分类的准确率来确定每个样本的权值将修改全职的新数据送给下层分类器进行训练
然后呢
将每次训练得到的分类器融合起来
作为最后的决策分类器
我知道没有研究过机器学习的大部分人一定不知道我前面在说什么
但只要知道它经过每一张图片的学习准确率呢
就会更高一些
直到最终它就可以分辨什么才是人脸
刚才提到的只是机器学习里面非常非常小的一个例子
只是希望能够通过他让大家能够大致了解到其实如今我们的创造力是正在奋力的追赶我们的想象力
近几年科学家们已经不满足于一些普通的机器学习了他们的热衷于让AI 往机器学习中的神经网络和深度学习的方向去走
他们试图建立一种模仿人脑内部神经网络的模型
从而呢在旗下衍生出一个又一个类似于前面提到的识别人脸这样的专家级的系统
而相信
借助这些模型不仅仅是计算机视觉
人工智能的各个方面呢
都能更贴近于真实的人类
从而呢
最终有一天能够得到堪称真正意义上的人工智能
但这里呢
我们还是要说相信大家都明白这个道理就是光是识别和描述他可能还是不够的
比如说我们开发出了一种系统
它能够识别苹果
包括在任何情况任何角度任何运动状态
甚至它能够知道这个苹果是不是被咬过
但是这个系统却没有办法去识别一个橘子
并且他甚至还都不能告诉人们啥是苹果是不是可以吃尺寸如何或者苹果还有哪些具体的用途
那对于我们人类来说
大脑的剩余部分就由这些组成包括长短期记忆
其他感官的输入注意力和认知力
从世界中万亿级别的交互中收获的10亿级的知识
这些知识呢
将通过我们很难理解的方式被写入互联的神经中
而要复制它
比起我们遇到过的任何事情都要更加的复杂
这一点呢
就是计算机科学和更加普遍的人工智能领域的前沿了
计算机科学家
工程师
心理学家神经学家和哲学家呢
是正在通力合作
但是呢也只是刚刚形成了关于意识运作的概念还远远达不到真正模拟他的地步
当然
即使在如此早期的阶段
计算机视觉却仍然已经发挥了很大的作用
像是在摄像头领域前面说过的面部和笑容的识别
又或者在自动驾驶领域
他呢
已经能够读取交通信号和注意行人
工厂里的机器人呢
已经能够通过它来检测一些普通人根本注意不到的细节瑕疵
虽然说最终要实现和人类一样去看
仍然有很漫长的一段路要走
但是如果能够实现的话
那一定会是一个非常美妙的未来
别忘了从第一台计算机诞生到如今也仅仅过了7 1年而已
计算机视觉也好
人工智能领域也好如今呢
都是刚刚处在起跑阶段
而AI 眼里的世界最迷人的地方不在于内篇数字
而是这背后可能包含的关于未来的无限风光
好吧
原来是这样就是这样
说起来好久没有一个人录节目了
上一回
没有记错的话
应该还是在2015 年的十月份本来呢
我是以为现在有姜文有紫琳
同时也有水兄原来是这样很难再出现旭东一个人叨叨叨的情况
但是无巧不成书嘛
这一周就碰到了他们三位同时有事的情况
呃
本来我也想过要不要跳票
但是每每想到有很多朋友每周五的时候就会等着节目的更新实在不想让大家失望
所以呢还是用一个人叨叨叨的方式和大家分享了一期其实和咱们以往节目风格不太一样的内容啊
这篇文案熟悉我教育背景的朋友应该能够想到他一定不是我写的啊
这篇文案的作者呢
叫御前带刀侍卫啊
现在呢
是羊刀友会比零的一名成员可以感觉的出来他应该从事
就是计算机视觉这个领域其实呢本来的文案是一个非常标准的双人缘要闻啊
这次呢
我也是破天荒的进行了一个泥改写就是把一问一答的模式改成了一个单人讲述啊改的不好也请御前带刀侍卫见谅
其实拿到他的这篇文案
我是比较震撼的啊
因为呢又是一个非常典型的论文式的文案写法
除了每一页都有注脚
最后呢
还附上了参考书目啊
可以看到这里边儿是涉及到了大量的英文书籍
那当然还有很多参考的这个文章
也谢谢这位朋友看得出来是花了很多心思的
他呢
也是希望以此文献给广大的计算机视觉以及人工领域奋战的前辈和朋辈们呃
他说
感谢彼此共勉
谢谢你
当然
也期待所有希望通过原来是这样
这个平台来分享知识的大神们啊
可以通过加入原样文案组的方式来给原来是这样提供文案
毕竟我一个人的知识面肯定是相当有限的
而我擅长的领域呢
也无外乎就是那么几个原来是这样的
也是希望可以搭建起这样子的一个平台
就是通过各行各业的大神们从自己所熟悉的视角出发来分享知识最终呢
帮助大家一起来构建一张更完整的知识网络
还是简单的做几个广告啊
如果说大家对于旭东本人感兴趣可以关注新浪微博搜索旭东叙事旭日的旭冬是上面一个山下面一个冬当然微信订阅号
也可以搜旭东刀科学在每个周六也会有关于本期节目地延展阅读
还有背景音乐歌单
百度贴吧也是旭东刀科学欢迎各位的加入
也欢迎大家加入原样叨友会
现在呢
是我们的第七群文曲
现在的人数已经破千了
非常的热闹
也是期待大家的加入和探讨
如果说大家觉得每周光听原来是这样
还不过瘾的话
现在原来是这样的
也是有了第一个付费精品节目
那就是天文原来是这样
这是旭东河水兄共同主讲的一个希望能够从天文的专业角度出发来帮助大家构建一个正确的天文官的天文科普节目
想要订阅的话
也可以关注一下旭东刀科学
我们的周边的以来就有这档节目的详细介绍
哦对了
另外呢
咱们科学声音理性的力量主题演讲会的北京站已经在上周启动了门票订购
那如果说你是北京或者北京周边的朋友在7月15号这一天刚好有空的话不妨到现场和咱们聚一聚
Er 订票这件事儿呢
真的要抓紧了呢
具体的方法呢
在科学声音包括徐岽叨科学的微信订阅号可以看一下活动那一栏也有对应的图文
最后呢
也要祝福即将进入考场的
本届的高三考生啊
不知道过去这一年的原来是这样
有没有可能在今年的高考当中
再押对几道题目啊
如果说真的有幸压中的话
也欢迎大家在考完之后在我们的评论区留言
当然无论怎么样放松心态
发挥出自己的好状态吧
总之祝福大家好啦
本周的原来是这样
真的就是这样了
代表本次节目的撰稿人御前带刀侍卫
感谢各位的收听
当然
也感谢所有通过打赏撰稿参与志愿组或者订阅我们付费精品节目等所有方式支持和帮助过我们的朋友原来是这样的发展真的离不开各位
我是旭东咱们下周再见
哎
你们知道吗
一个人录节目有很多缺点一呢
是实在讲不出什么好玩的彩蛋
二来呢这篇文案说起来也有80 00多个字了
要是两个人录的话怎么的也得有45 到50 分钟
可是我一个人路竟然正片30 分钟出头就录完了
哦
对了
姜文没有怀孕紫鳞没有怀二胎水兄
当然也不可能怀孕就是这样吧
下周应该不会一个人了