Google’s AI Course for Beginners (in 10 minutes)!
🔍 In this video, we unravel the layers of AI, Machine Learning, Deep Learning, and their applications in tools like #ChatGPT and Google #Bard
We first go through how AI is a broad field of study that encompasses #MachineLearning as a sub-field.
We then break down Machine Learning into supervised and unsupervised models, using real-world examples to illustrate their functions and differences.
We move deeper into Deep Learning: Learn about artificial neural networks and the power of semi-supervised learning in applications like fraud detection in banking.
Then we delve into Generative AI, differentiating it from discriminative models and demonstrating its capabilities in creating new, innovative outputs.
Finally we walk through Large Language Models (LLMs) and uncover the significance of LLMs in AI, their pre-training processes, and their customization for specific industry applications
00:00 Google’s AI Course in 10 Minutes
00:38 What is Artificial Intelligence?
01:27 What is Machine Learning?
03:28 What is Deep Learning?
05:15 What is Generative AI?
07:05 What are Large Language Models?
*👨🏻💻 WHO AM I:*
I’m Jeff, a tech professional trying to figure life out. What I do end up figuring out, I share!
如果你不是搞技术的, 但还是想学一点基础的 人工智能知识,那你就得好好看这个视频, 因为我把Google的一个4小时长的AI扫盲课程内容 都浓缩到了这10分钟的视频中。 其实我一开始并不对这个课程抱多大期待, 因为我觉得它 主要是讲概念上的东西, 而我们这个频道可不讲虚的。 以我对Google的了解, 这个课很可能会在1小时后被下架。 而且我竟然发现,这课所教的底层的概念性知识, 让我能够更好地运用像ChatGPT和Google Bard这样的工具, 还帮我清除了 我没有意识到的有关AI机器学习 以及大语言模型的一系列错误的认识。 那我们从最宽泛的问题说起, 什么是人工智能? 我只能很尴尬地承认, 我才发现之前也并不知道答案。 人工智能像物理学一样,是一整个研究领域。 而机器学习是 人工智能下的一个子领域, 这就好比热力学是物理学下的一个子领域一样。 再往下走一层,就是深度学习, 它是机器学习的子领域, 而深度学习模型 还能进一步分成判别模型, 生成式模型, 以及大语言模型,即LLMs。 而在我们都熟悉的ChatGPT和Google Bard 这样的应用背后的技术, 同样属于深度学习下, 且在LLM和生成式AI的重叠处。 各位可以留言告诉我 你之前知道这个吗? 既然我们现在已经对整个领域 有了初步的了解,也知道 不同的学科之间的关系, 我们现在就来看一下 各个学科层级的一些关键要点。 总的来说,机器学习是一个 利用输入数据来训练模型的程序。 训练后的模型,能进一步 基于全新的数据做出预测。 比如,如果你用耐克销售数据 来训练一个模型, 之后这个模型就能够 在阿迪达斯销售数据的基础上 去预测阿迪新鞋的销售表现。 机器学习模型的两种最常见的类型 分别是监督学习,和无监督学习。 这两者之间最关键的区别在于, 监督学习使用的是有标记的数据, 而无监督学习使用未标记的数据。 在这个监督学习的例子中, 这个散点图展示了 一个餐厅的单个账单总额和 小费金额之间的关系。 而且这些数据是有标记的。 蓝点等于顾客自取订单, 黄点等于商家派送订单。 这样使用监督学习模型, 我们下次就能根据账单总额和 是否自取或派送订单,来预测 我们能收到多少小费。 对于无监督学习,我们会去看 原始数据是否能够自动形成分组。 比如,这个图展示了 一个企业中员工任职年数 和其薪资收入之间的关系。 我们会看到,这一组员工的薪资/年数比例 比下面这组更高。 我们还知道,这些数据都未经标记。 如果这些数据有标记, 那我们会看到性别,工作年数, 所属部门,等等。我们现在就可以让这个 无监督学习模型来解决这样的问题, 比如这个新入职的员工 是否在高速成长? 如果他们在左边这组,答案就是肯定的。 如果在右边,则否。 专业技巧,这两个模型之间还有一个显著差异。 监督学习模型在 做出预测之后, 它会将预测结果 与用于训练模型的数据进行比较。 如果两者间存在差异, 它会尝试去缩小这个差异, 而无监督学习模型就不会这样。 对了,这个视频没有赞助, 但你们可以通过付费订阅我的 谷歌软件技巧文章来支持我。 可以到我的网站 了解更多详情。 对机器学习有了基本了解之后, 我们就可以开始了解深度学习了。 深度学习其实就是机器学习的其中一种, 它利用人工神经网络来进行学习。 别担心,你只需要知道 人工神经网络是 以人类大脑为灵感源泉的, 它大概就长这样, 一层层的节点和神经元。 节点和神经元越多, 模型就越强大。 由于这些神经网络的存在, 我们就可以进行半监督学习, 就是用一小部分标记数据 和一大部分未标记数据 来训练深度学习模型。 比如,一个银行会用深度学习模型来检测诈骗行为。 这个银行会花一点时间来 把5%的交易数据贴上 诈骗和非诈骗交易的标签。 由于银行没有足够多的时间和资源 去把所有的数据都打上标记, 剩下的95%的交易数据都是无标记的数据。 这个模型的秘诀在于 它利用这5%的标记数据 去学习一个任务涉及的基本概念, 这些是好的, 那些是坏的,好了。 这个模型会把前面学到的知识应用到 剩余95%的未标记数据上, 利用这整个新的数据集, 对未来的交易来做出预测。 这很酷,不过还没结束呢。 深度学习有两种模型, 即判别模型和生成式模型。 判别模型学习 数据的标记之间的关系, 而且它只能够给 这些数据点进行归类, 例如欺诈还是非欺诈。 比如现在你有一堆图片,或数据点。 你现在给他们打上 狗或者猫的标记。 判别模型会学习猫或狗的标签, 如果你提交了一张 狗狗的图,它就会 预判这个数据点的标记:一只狗。 现在我们终于说到生成式AI了。 和判别模型不同的是, 生成式AI模型学习的是数据的规律, 它在接收到一些输入之后, 比如我们给它一段文本指令, 他们会根据刚学到的数据规律, 来生成新的内容。再以刚才的动物来举例, 这些图片或者数据点 并没有被标记为猫或者狗, 生成式模型会去寻找规律, 噢这些数据都含有 两只耳朵,四条腿,一条尾巴,爱吃狗粮, 还会犬吠。当你让它生成 一个叫做狗的东西时, 生成式模型会根据之前学到的规律 生成一个全新的图片。 有一个简单的方法能让我们轻松辨别出 某个模型是否是生成式AI。 如果输出结果是数字,类别(比如垃圾或非垃圾信息), 或者概率,它都不是生成式AI。 只有当它生成自然语言 (文本或语音),图片,或声音时, 它才是生成式AI。 生成式AI生成全新的样本, 类似于用来训练它的那些数据。 接下来说说不同类型的生成式AI模型。 我们大多数人都熟悉 ChatGPT或Google Bard这样的文本转换模型, 其他常见的模型类别还包括 文本到图像模型,比如Midjourney, DALL·E,以及stable diffusion。 它们不仅能生成图片,还能编辑图片。 文本到视频模型, 诶嘿想不到吧, 它们能生成和编辑视频。 比如imagen video,CogVideo还有这个 名字非常有创意的make a video。 文本到3D模型可用来创作游戏素材, 一个不太知名的例子是OpenAI的shap-e模型。 最后,文本到任务模型 是被训练来专门完成某个具体任务的。 比如,当你输入 @Gmail请你概括我的未读邮件, Bard会通读你的收件箱, 然后概括出你未读邮件的内容。 接下来说说大语言模型。 别忘了LLMs也是深度学习的一个子集, 尽管两者有一些重叠, LLMs和生成式模型并不是同一回事。 它们俩有一个重要的区别, 即大语言模型通常是 先用大量数据进行预训练, 再根据具体的目的进行精细的微调。 这是啥意思? 假设你有一只宠物狗,你可以提前训练它学会 一些基础的指令,比如坐下,过来,趴下, 还有待着别动。学会了之后, 它就是一只乖狗狗,还是个通才。 但如果这只乖狗狗要变成一只警犬, 导盲犬,或者狩猎犬,它就要接受 更具体的训练,从而被微调成为 那个特别的专家狗狗。 大语言模型也是同理。 它们先被训练出一些基本语言处理技能, 比如说分类文本, 回答问题, 概括文档,以及生成文本, 然后再用更小一点的行业数据集 把这些大语言模型微调成行业专家 去解决具体的行业问题, 例如零售、金融、医疗和文娱等领域。 在真实世界中,这可能意味着 一些大型科技公司 预训练过的大语言模型, 被医院用自己一手的 医疗数据来进行微调, 从而提升X光或其他检测的 诊断正确性。 这是一个双赢的局面, 因为大型公司花费 数十亿美元来打造一个通用模型, 或者是大语言模型,然后再将这些模型 卖给那些更小型的机构, 比如零售、银行、医院等。 他们虽有专业的行业数据可用于微调模型, 却没有足够的资源来 打造自己的大语言模型。 专业技巧,如果你想学习这个免费课程,你可以去。 如果你想做笔记,可以在视频上点击右键, 复制当前时间的视频网址, 你就能够快速 找回到那个视频片段。 这个课程一共有5个模块, 你每完成一个模块, 就会获得一个小奖章, 由于这个课程确实是比较理论化的, 所以你一定要去看看我的 关于如何掌握AI提示语技能的视频。 我们下期视频再见,同时, 祝你拥有美好的一天!
Who else thought ChatGPT and AI were the same thing?
