-
一文读懂: Transformer
本文旨在帮助不懂技术的朋友轻松搞懂Transformer 模型架构和思想,所以不含代码,纯讲解。 前言 Transformer模型之所以被称为“Transformer”,是因为它的核心功能是对输入数据的矩阵进行变换处理。(哈哈,目前没有中文名,不是变形金刚也不是翻译) 这种变换是通过计算矩阵内部各个向量之间的关系来实现的,目的是去除无效信息并加强有效信息。在这个过程中,组成矩阵的向量的值会发生变化,但形状保持不变。这样的变换使得模型能够更好地解决最终数学问题,计算最优解。 大模型爆红,一方面给互…
-
运行在浏览器中的深度学习框架,开源了
百度近期开源了国内首个以JavaScript实现的Web端推理引擎 Paddle.js。Paddle.js用于帮助前端工程师更加简单地将智能化因素引入网页中,让Web前端可以实现更多的能力。 通过浏览器来访问网页应用浏览内容具有更低的门槛和更广泛的传播度,能够在网页中融入智能化因素将会为用户体验插上一对腾飞的翅膀。传统的智能化效果由于模型大小、设备机器算力的问题,多数是放在服务端实现的,但是这需要多次与服务器进行网络上的信息交互,用户体验被打折。 Web前端作为互联网中离用户最近的一环,也希望借…
-
行业观察:世界人工智能发展究竟到了什么水平?
关于人工智能在当今科技界的发展水平,学术界、产业界和媒体界可能会有不同的看法。我经常听到的一个说法是:现在基于大数据与深度学习的人工智能是一种完全新颖的技术形态,它的出现能够全面地改变未来人类的社会形态,因为它能够自主进行“学习”,由此大量取代人类劳力。我认为这里有两个误解: 第一,深度学习并不是新技术;第二,深度学习技术所涉及的“学习”与人类的学习并不是一回事,因为它不能真正“深度”地理解它所面对的信息。 深度学习不是新技术 从技术史角度看,深度学习技术的前身,其实就是在20世纪80年代就已经…
-
2020年深度学习框架对比速读
众所周知,在机器学习框架领域,PyTorch、TensorFlow已分别成为目前学术界和工业界使用最广泛的两大实力玩家,而紧随其后的Keras、MXNet等框架也由于其自身的独特性受到开发者的喜爱。本文主要是为部分初学者提供建议,框架并无“最好”与“最坏”之分,选择最终归结于您的技术背景、需求和期望。 TensorFlow:出身豪门的工业界霸主 TensorFlow于2015年11月面世,基于Apache License 2.0协议发布,由Google Brain团队研发。到目前为止也是gith…