当前位置:网站首页>从概念认识AI

从概念认识AI

2022-08-11 05:23:00 想要成为程序媛的DUDUfine

从概念认识AI

什么是AI?

AI的全称是“Artificial Intelligence” ,翻译过来是“人工智能”。

人工智能指的是利用计算机和机器来模拟人类思维解决问题决策的能力。

简单地说,人工智能是一个结合了计算机科学庞大数据集来解决问题的领域,其中数据算法算力是人工智能三要素
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tOfvQR9G-1659969632461)(./AI.jpg)]

人工智能还包括机器学习深度学习的子领域,这两个领域经常与人工智能一起被提及。这些学科由AI算法组成,这些算法的目的就是构建基于输入数据进行预测或分类的专家系统。

人工智能的类型— Weak AI vs. Strong AI

弱人工智能也被称为狭义人工智能人工狭义智能(Artificial Narrow Intelligence, ANI),是指经过训练并专注于执行特定任务的人工智能。
我们今天周围的大多数AI就是属于弱AI。
用“狭义(‘Narrow’ )”来描述这类AI可能更准确,因为它一点也不弱;它可以支持一些非常强大的应用,比如苹果的Siri、IBM Watson和百度的阿波罗(Apollo)自动驾驶,科大讯飞的语音识别等,这些都是很有代表性的AI产品。

强人工智能人工通用智能(Artificial General Intelligence, AGI)和人工超级智能(Artificial Super Intelligence, ASI)组成。
人工通用智能(AGI),或通用人工智能,是人工智能的一种理论形式,即机器将拥有与人类相等的智能;它将具有自我意识,有能力解决问题、学习和规划未来
人工超级智能(ASI)——也被称为超级智能,它将超越人脑的智能和能力。
虽然人工智能研究人员在墙人工智能领域进行着不懈的探索,不过强人工智能目前仍然完全是理论,还没有实际应用的例子。
目前ASI最好的例子可能来自科幻小说,比如《2001太空漫游》中的超级计算机助手HAL。

深度学习(Deep learning) vs. (machine learning)机器学习

说到人工智能,深度学习和机器学习这两个词经常被提起,但是二者还是有细微差别的。
深度学习机器学习都是人工智能的子领域,而深度学习实际上也是机器学习子领域。关系如图:

深度学习实际上是由神经网络组成的。深度学习中的“深度”是指由超过三层(包括输入和输出)组成的神经网络,可以被认为是一种深度学习算法
这通常用下面的图表来表示:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2O7cSMbU-1659969632464)(./DeepNeuralNetwork.jpeg)]

深度学习和机器学习不同之处在于每种算法的学习方式
深度学习将过程中的大部分特征提取部分自动化,消除了一些所需的手动干预,并支持使用更大的数据集。
可以把深度学习想象成“可伸缩的机器学习”。传统的“非深度”的机器学习更依赖于人类的干预来学习。
人类专家确定特征的层次结构,以了解数据输入之间的差异,通常需要更多结构化数据来学习。

“深度”机器学习可以利用标记数据集(也被称为监督学习),但它不一定需要标记数据集。它可以接收原始形式的非结构化数据(例如文本、图像),并且可以自动确定特征层次结构,从而区分不同类别的数据。与机器学习不同的是,它不需要人工干预来处理数据,这让我们能够以更有趣的方式来扩展机器学习。

人工智能应用

人工智能系统已经在现实世界中有无数的应用。下面是一些最常见的例子:

  • 语音识别:也被称为自动语音识别(ASR)、计算机语音识别或语音到文本,它是一种使用自然语言处理(NLP)将人类语音处理成书面格式的能力。许多移动设备都将语音识别纳入其系统以进行语音搜索。比如苹果的智能语音助手siri,或者语音转译。
  • 客户服务:虚拟客服正在取代人工客服。通过虚拟客服,借助AI进行意图分析,可以帮助代理或服务者做出跟好的决策并提升客户满意度。比如经常接到的虚拟客服电话
  • 计算机视觉:这种人工智能技术使计算机和系统能够从数字图像、视频和其他视觉输入中获得有意义的信息,并基于这些输入采取行动。这种提供建议的能力将其与图像识别任务区分开来。在卷积神经网络的支持下,计算机视觉在社交媒体的照片标记、医疗保健的放射成像和汽车行业的自动驾驶汽车中都有应用。
  • 推荐引擎:利用过去的消费行为数据,人工智能算法可以帮助发现数据趋势,用于制定更有效的交叉销售策略。它用于在在线零售商结账过程中向客户提供相关的附加建议。
  • 自动股票交易:旨在优化股票投资组合,不需要人工干预,人工智能就能驱动的高频交易平台每天进行数千甚至数百万笔交易。

人工智能的历史里程碑

“会思考的机器”的概念可以追溯到古希腊。但是自从电子计算出现以来(人工智能发展中的重要事件和里程碑包括以下几点:

  • 1950年:阿兰·图灵出版了《计算机器与智能》。图灵因在二战期间破解纳粹的ENIGMA密码而闻名,他在论文中提出了“机器会思考吗?”,并引入了图灵测试(Turing Test),以确定计算机是否能展示出与人类相同的智能(或相同智能的结果)。从那时起,图灵测试的价值就一直备受争议。
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PH6oJDIR-1659969632465)(./turingTest.jpg)]

“图灵测试”如图,让一个人坐在电脑前,跟另一边用键盘进行对话,如果这个人分不清跟自己对话的是一个人还是一个机器,那么这个对话机器就通过了图灵测试并具备人工智能。

  • 1956年:约翰·麦卡锡在达特茅斯学院首届人工智能会议上创造了“人工智能”一词。(麦卡锡后来发明了Lisp语言。)同年晚些时候,艾伦·纽威尔、J.C.肖和赫伯特·西蒙创造了“逻辑理论家”,这是有史以来第一个运行的人工智能软件程序。
  • 1967年:弗兰克·罗森布拉特(Frank Rosenblatt)制造了马克1感知机(Mark 1 Perceptron),这是第一台基于神经网络的计算机,它通过试错“学习”。仅仅一年后,马文·明斯基(Marvin Minsky)和西摩·帕佩特(Seymour Papert)出版了一本名为《感知机》(Perceptrons)的书,这本书虽然成为神经网络领域的里程碑式作品,但是由于该书证明的当时单层神经网络的局限性,让当时人工神经网络研究陷入了多年的停滞和低潮。
  • 20世纪80年代:使用反向传播算法进行自我训练的神经网络在人工智能应用中得到广泛应用。
  • 1997年:IBM的“深蓝”(Deep Blue)在一场国际象棋比赛中击败了当时的世界象棋冠军卡斯帕罗夫(Garry Kasparov)。
  • 2011年:IBM沃森在《危险边缘》节目中击败冠军肯·詹宁斯和布拉德·拉特!
  • 2015年:百度的Minwa超级计算机使用一种叫做卷积神经网络的特殊深度神经网络来识别和分类图像,其准确率高于一般人类。
  • 2016年:DeepMind的AlphaGo程序由深度神经网络驱动,在一场五局的比赛中击败了世界围棋冠军李索道。考虑到游戏进程中可能出现的大量招式(仅4步就超过14.5万亿),这场胜利意义重大。随后,谷歌以4亿美元的价格收购了DeepMind。

机器学习中的特征是什么呢?

机器学习涉及算法模型的设计和开发,使计算机无需特定的编程就能进行学习。机器学习有很多应用,包括回归、分类、聚类、自然语言处理、音频和视频、计算机视觉等。不同的问题机器学习需要使用不同的算法训练一个或多个模型。

机器学习模型最重要的一个方面是识别特征,有助于创建优秀模型的特征,可以很好地处理潜在的数据。

机器学习模型都是关于为数据的输入数据转换找到合适的表示/特征,使其更适合手头的任务,例如分类任务,不同的分类任务的特征和参数就不一样。

在机器学习的情况下,数据科学家有责任从给定的数据集中手工制作一些有用的表示/特征。
在深度学习的情况下,可以基于底层算法自动学习特征表示。这也是深度学习之所以能迅速发展的原因之一,就是它可以完全自动化机器学习工作流中最关键的步骤:特征工程
提出新表示或特征(包括原始特征和衍生特征)的过程称为特征工程

机器是怎么学习的?

机器学习是学习一个或多个数学函数/模型,使用数据来解决特定的任务。任何机器学习问题都可以用三个参数的函数表示。

机器学习问题= < T, P, E >

上式中,T代表任务,P代表业绩,E代表经验(过去的数据)。机器学习模型学习使用过去的数据来执行任务,并以表现(错误)来衡量

机器学习模型使用可以表示为**原始特征(与数据相同)派生特征(从数据派生)**的数据进行训练。

在机器学习模型中,特征就是自变量。在任何具体的机器学习问题中,需要学习的是这一系列的特征(自变量)特征的系数、以及用于提出适当的函数或模型的参数(也称为超参数)。

我自己把它抽象成方程式:

y = Ax+b
y= Ax^2 +  Bx^3+ C lnX 像这种复杂式子我们就很难计算出结果来。

而机器学习所做的,就是代入数据,算出结果,我们通过调节参数,而使代人变量后结果更符合我们的预期。

为了帮助理解特征,我们举几个例子。以下是一些可以被称为机器学习模型特征的例子:

  • 预测心脏病风险的模型可能具有下列特征:
    • 年龄
    • 性别
    • 重量
    • 这个人是否吸烟
    • 是否患有糖尿病等疾病。
  • 一个预测一个人是否适合一份工作的模型可能有一些特征,如教育资格、经验年限、在该领域的工作经验等
  • 一个预测一个人衬衫大小的模型可能包含诸如年龄、性别、身高、体重等特征。

什么样的“特征”才是好的?

好的特征的特点应该是:

  • 必须在大多数数据样本中找到特征:优秀的特征代表可以跨不同类型的数据样本应用的独特特征,而不仅仅限于一个数据样本。
  • 特征应该是独特的,区别于其他不同类型的数据,能够表现出数据样本的特性,
  • 实际上某些特证在本质上具有偶然性,在大量数据集中不是特征,而在特定的数据样本中又是普遍存在,这个时候在多种数据样本处理中应该被舍弃。

当分析模型的特征时,根据第一原则进行推理会有很大帮助。在第一性原则思维中,我们将问题分解为各个组成部分,并努力找出最基本的原因第一个原因。相对于代表真实世界问题的机器学习模型,这些首要原因可以成为模型的特征。例如,如果需要模拟学生在考试中取得好成绩或坏成绩的真实情况,我们可以运用第一性原则思考,并尝试得出与学生在考试中取得成绩相关的最基本原因,如以下:

  • 这些书指的是什么?它们是学校或老师推荐的书,还是额外的书?
  • 学生是否接受额外辅导?
  • 学生在课堂上认真做笔记吗?
  • 学生是否参考课堂笔记作为准备材料?
  • 学生是否得到父母的帮助?
  • 学生是否得到兄弟姐妹的帮助?
  • 学生是内向还是外向?

大数据 VS 机器学习

大数据(Big Data)又称巨量数据,指的是传统数据处理应用软件不足以处理的大或复杂的数据集的术语。

大数据也可以定义为来自各种来源的大量非结构化、半结构化或结构化数据组合而成,以至于传统的数据管理技术无法有效或高效地处理、存储和管理它。常规数据仓库不太合适,而Spark、Hadoop、NoSQL数据库和其他大数据平台和工具的出现填补这一空白,并使企业能够建立数据湖作为所有这些数据的存储库。

大数据(Big Data)的核心是利用数据的价值,它帮助企业更好地了解客户,做出更好的业务决策,改进业务流程,跟踪库存,监控竞争对手;
而机器学习可以跨大量数据提供认知能力,能够将大数据分析提升到一个新的水平。对于希望最大化其数据潜在价值的公司来说,就可以使用机器学习算法进行大数据分析。机器学习工具使用数据驱动的算法和统计模型来分析数据集,然后从已识别的模式中得出推论或基于它们进行预测。

所以机器学习是利用数据价值的关键技术。对于大数据而言,机器学习是不可或缺的。而对机器学习而言,越多的数据可能会提升模型的精确性。为什么说"可能",因为数据有可能是有用的数据,也有可能是垃圾数据,错误的数据就会对模型的训练产生干扰了。
同时,复杂的机器学习算法的计算时间也迫切需要分布式计算与内存计算这样的关键技术。因此,机器学习的兴盛也离不开大数据的帮助。 大数据与机器学习两者是互相促进,相依相存的关系。

深度学习

深度学习试图模仿人脑,尽管它的能力远远不足以使系统能够以难以置信的准确性对数据进行聚类和预测。

深度学习是机器学习的一个子集,机器学习本质上是一个具有三层或更多层的神经网络。这些神经网络试图模拟人脑的行为,尽管与人脑从大量数据中“学习”的能力相去甚远。虽然只有一层的神经网络仍然可以进行近似预测,但额外的隐藏层可以帮助优化和细化精度。

深度学习推动了许多人工智能(AI)应用程序和服务,这些应用程序和服务可以提高自动化程度,在无需人工干预的情况下执行分析和物理任务。深度学习技术是日常产品和服务(如数字助理、语音电视遥控器和信用卡欺诈检测)以及新兴技术(如自动驾驶汽车)的基础。

原网站

版权声明
本文为[想要成为程序媛的DUDUfine]所创,转载请带上原文链接,感谢
https://blog.csdn.net/DUDUfine/article/details/125337802