欢迎访问 上海聆英企业管理咨询有限公司!
搜索
汽车新视野
人工智能是企业发展的必经之路
2024-12-18
Leo Sun

图片


ChatGPT的诞生

自然语言模型


OpenAI 于 2015 年成立,是一个非营利性的人工智能研究公司,主要由微软、马斯克等投资。

该公司于2018 年发布GPT-1,它是第一个基于 Transformer 架构的预训练语言模型。GPT - 1 证明了在大规模无监督文本数据上预训练语言模型,然后在特定任务上进行微调可以取得良好的性能。

2019年发布GPT-2,展示了预训练语言模型在零样本学习(Zero - Shot Learning)方面的潜力。

2020 年发布的 GPT - 3 是一个巨大的飞跃。它具有 1750 亿个参数,是当时规模最大的语言模型。

2022 年 OpenAI 推出了 ChatGPT。它是基于 GPT - 3.5 架构微调开发的对话式人工智能模型。2023 年发布ChatGPT - 4,其规模是 GPT-3 的 45 倍左右。

相比之前的版本,ChatGPT - 4 在理解复杂语义方面有显著进步。它能够更精准地分析文本中的细微差别、隐喻和隐含意义。其知识储备更加丰富,涵盖了广泛的领域,包括科学、历史、文化、技术等。

ChatGPT - 4 已经开始探索多模态的交互。例如,它可以对输入的图像内容进行一定程度的描述或者基于图像内容进行相关的问答交互。

图片

华裔科学家李飞飞

机器视觉模型

李飞飞:美国国家工程院、国家医学院、艺术与科学院三院院士,现代人工智能的关键催化剂 ImageNet 创建者,斯坦福大学计算机科学系首任红杉讲席教授,斯坦福大学以人为本人工智能研究院(HAI)联合院长,前谷歌副总裁、谷歌云人工智能及机器学习首席科学家,斯坦福大学人工智能实验室第七任主任,《时代》“百大AI影响力人物”。
1976年出生于中国北京,长于成都;1992年随家人赴美;1995年被普林斯顿大学物理学专业以全额奖学金录取;2005年在加州理工学院获得电气工程博士学位;
2009年在斯坦福大学完成ImageNet的初始版本,包含1500万张图片,涵盖了2.2万个不同类别;2012年在她发起举办的 ImageNet 大型视觉识别挑战赛第三届比赛上,神经网络算法AlexNet识别准确率高达85%,开启了新一轮深度学习革命。
她创建的 ImageNet 数据集,包含了数以百万计的带标注图像,为图像识别算法的训练提供了丰富且高质量的数据基础。
她的自传《我看见的世界》讲述了她自己从底层移民成长到顶尖科学家的经历,也是一部波澜壮阔、跌宕起伏的人工智能发展史。

人工智能技术

三大类别

自然语言处理,可以利用语言大模型,处理复杂的语言理解,能够生成高质量的文章、图像、实时翻译、网络搜索、人机对话、指令输入等。
机器视觉处理,可以精确地识别物体、图像、抓取三维空间的物体,分析人、物之间的关系。
增强学习功能,在复杂的环境下提高决策能力,如在游戏中,用更复杂的策略战胜人类,并在现实世界中精确地进行资源管理、物流调度等。

人工智能应用

不同领域

人工智能在医疗领域,可以参与精准的医疗诊断和病理分析,提供个性化治疗方案,进行药物开发,个人健康档案管理,智慧医院管理,提升政府医疗服务能力。
人工智能可以改变教育形态,为学生分析学习路径规划,自动生成课程,提供自适应学习系统,虚拟仿真1V1语言、数学教学,进行作业批改分析,口语测试,提供游戏化教学。
人工智能在金融领域,可以进行风险评估与监控,高频交易和优胜投资策略,分析客户画像及精准营销,防止诈骗和网络安全防护,数据挖掘和决策支持。
人工智能在制造领域,可以利用数字孪生动态调度生产和物流,利用机器视觉进行产品检测,数据分析进行设备维护、机器人写作,供应链和订单趋势预测、库存管理。
人工智能在电子消费行业,可以智能推荐商品、内容,机器客服进行智能帮助,动态定价和制定销售策略,客户画像及AI直播带货。
人工智能在服务行业,可以提供人形机器人应用在各个领域,如服务员、家庭护理师、个人陪伴、养老护理。
除此以外,环保、能源、通信、房地产、科研、体育、交通、政务领域人工智能都将得以发展和应用,都将深层次地改变行业的形态和发展趋势。

人工智能全球分工

美、欧、中

美国:技术研发领先地位,拥有众多顶尖科技巨头如谷歌、微软、OpenAI、英伟达等,在人工智能的基础研究、算法开发、硬件制造等方面投入巨大,推动了自然语言处理、计算机视觉、强化学习等关键技术的不断突破。
英伟达等公司在人工智能芯片领域占据重要地位,其生产的 GPU 等芯片为全球人工智能训练和推理提供了强大的计算支持,同时美国的云计算服务提供商如亚马逊、微软等,也在全球人工智能基础设施建设中发挥着重要作用。
美国也吸引了全球大量优秀的人工智能人才,其高校和科研机构在相关领域的研究和教育水平处于世界领先地位。
欧洲:在人工智能的学术研究方面取得了不少优秀的科研成果,但由于欧盟严格的监管框架,一定程度上限制了人工智能创新、开发和部署的速度。
中国:庞大的人口基数和快速发展的互联网经济产生了海量的数据,为人工智能模型的训练提供了丰富素材。大模型基本是基于美国的现有大模型进行的数据优化。近年来如寒武纪等企业的芯片产品,以及工业富联等企业在服务器制造方面的优势,为国内人工智能产业的发展提供了有力支撑。
总结以上,美国拥有人工智能科技的原生能力,控制着芯片算力和算法等核心,欧洲属于谨慎跟随,但与美国交流充分获取模型能力,中国则依靠海量数据和最强的服务器基础设施能力训练模型。

无人驾驶全球进展

特斯拉

特斯拉是最早在自动驾驶上应用端到端大模型的企业,利用Transformer(语言大模型)+BEV(鸟瞰机器视觉)+ Occupancy Network(占用网络感知算法)。
其FSDv12版本开始的自动驾驶,用一个整合的神经网络结构取代了传统的感知、规划和控制等多个分模块方案,直接输入传感器数据,输出转向、制动和加速信号,实现了实际意义上的端到端大模型。
特斯拉自动驾驶云端大模型参数规模已达 10 亿量级,FSD V12.5 的参数量是 V12.4 的 5 倍。马斯克旗下的 xAI 公司推出的 grok-1 大模型,参数量为 3140 亿,是目前全球参数量最大的开源大语言模型。
2024 年 12 月,特斯拉宣布了全自动驾驶(FSD)系统的最新版本 V13.2,并发布了相关实测视频。该版本实现了从起点到终点的 “点对点” 全自动驾驶,无需人工干预,车辆在停车状态下可自动激活自动驾驶系统,并在到达目的地后自动解除。
此外,其自动驾驶系统的平稳性超越了一般的网约车车辆,还成功解决了前一版本中方向盘抖动的问题,并且能够自动倒车进入超级充电桩车位。其训练数据量大幅增加,达到4.2倍的提升,而训练算力则增强了5倍。
特斯拉还计划于 2026 年投产没有方向盘和油门刹车踏板的无人驾驶出租车 Cybercab,该车成本预计低于 3 万美元,随着规模铺开,运营成本有望从 1 美元 / 英里降到 0.28 美元 / 英里。

无人驾驶国内进展

华为、小鹏、百度

2024 年 4 月,华为发布了以智能驾驶 ADS 3.0,实现了部分模块的模型化,其以 GOD(通用障碍物识别)大模型负责感知,PDP(预测决策规控)网络负责预决策和规划,与特斯拉不同的,这仍是分段式端到端架构,仍未放弃激光雷达的方案。
2024 年 5 月,小鹏汽车发布国内首个量产上车的端到端大模型,方案追随了特斯拉的纯视觉方案,也仍旧是部分模块的模型化。2025 年小鹏部署的云端算力将达到 10 EFLOPS 以上。
2024 年 5 月,百度发布了全球首个 L4 级端到端的自动驾驶大模型 Apollo ADFM,与特斯拉一样采用 BEV+OCC+Transformer 即 B.O.T 的 “纯视觉” 技术方案,并且以百度地图 LD 作为自动驾驶原生地图,而特斯拉则不依赖于高精地图。
百度旗下无人驾驶网约车萝卜快跑仍装载了激光雷达,目前已运行一年以上,2024 年第三季度的自动驾驶订单为 98.8 万单,同比增长 20%,进入10 月全无人驾驶单量的比例进一步增加至 80%。

大模型的挑战

数据、算力、算法、伦理

端到端大模型需要海量的数据来学习各种场景和模式。
无人驾驶重在机器视觉,要让模型学会在各种天气(晴天、雨天、雪天、雾天)、不同路况(高速公路、城市道路、乡村道路)以及复杂交通场景(交通拥堵、交通事故现场、道路施工)下做出正确决策。
智能座舱重在语音识别,对于自然语言处理等领域,需要收集不同语言风格、主题、领域的文本数据,以保证模型能够理解和生成多样化的语言表达。
截至 2024 年,特斯拉的电动车全球保有量接近 700 万辆, 比亚迪约为800 万辆左右。
端到端大模型的训练计算资源消耗巨大。以深度学习模型为例,训练一个大规模的 Transformer 模型可能需要数千张高性能 GPU 卡,并且训练时间可能长达数周甚至数月。
据马斯克透露,到 2024 年底特斯拉的 Dojo 超级计算机AI 训练算力将达到相当于 85000 块英伟达 H100 芯片的水平,即最高算力可达 340 Exa-Flops。国内规划投建的最大规模的弘信电子规划庆阳算力中心为40Exa-Flops,特斯拉是其8.5倍。
美国等西方国家对高性能 AI 芯片实施严格的出口管制,国内一些大模型创业公司,即便融到资也难以买到所需的英伟达芯片。
国内过于偏向端到端大模型的应用研究和实验开发,而基础研究的投入相对不足。
中国在人工智能领域仍处于“跟跑”状态,尤其是在前沿理论和原创成果方面与美国等国家存在明显差距。
高端人才的缺乏以及技术生态的不完善依然是制约发展的重要因素。
相关法律法规和伦理标准的制定滞后,导致社会对人工智能潜在风险的认识不足。这种情况可能引发社会信任危机,并影响技术的广泛应用。

专家观点

AI=全新工业革命

黄仁勋指出,AI正以空前的速度改变各行各业,推动技术革命。他将OpenAI形容为“我们这个时代最具影响力的公司之一”,并强调机器学习和通用人工智能(AGI)在未来发展的中心地位。
他预见未来“AI员工”将与人类并肩工作,在芯片设计、营销、供应链等领域发挥重要作用。这种协作不仅能提高工作效率,还可能创造出更高质量的就业机会,使人们能够专注于更具创造性和战略性的任务。
马斯克预测,人工智能的能力将在未来四年内提升1万倍,并预计到2028年,AI将能够完成所有人类可以做的工作。特斯拉计划推出完全无人驾驶的汽车和人形机器人Optimus,这些产品将对劳动力市场产生深远影响。
马斯克在社交媒体上直接称F-35战斗机为“一个烂设计”("a shit design"),并认为“载人战斗机在无人机时代无论如何已经过时了”。


聆英观点

AI=企业发展的关键

1.人工智能将在10年内在全球范围内冲击所有行业,无人驾驶将在2025-2026技术成熟,在没有政策限制的情况下将被大规模应用;
2.国内企业在人工智能的基础性研究处于跟随状态,人才培养和继承断档,一旦美中贸易脱钩,将使我们在人工智能领域远远落后;
3.借助巨量资本的力量、凭借海量的数据、扶植有潜力的芯片企业、搭建更大规模的算力中心,可以使语言和视觉大模型快速迭代;
4.汽车行业企业普遍仍在传统工业思路的轨迹上,并未意识到全新的科技革命已经到来,即使已经认知到了,但很少有迫切的战略变革来扭转局面。
- END -


END

*版权声明:本文为聆英咨询原创文章,在未经允许的情况下请勿转载!

本文地址:https://www.lean-in.space//industry/detail/id/1330.html

标签: 自动驾驶
0
好文章,需要你的鼓励
微信扫一扫分享该文章
0
点击收藏该文章
公众评价(0)
0/120
0
0
0
专注汽车市场与战略咨询
联系我们
地址 :上海市普陀区真新经济城
邮箱 :leo.sun@lean-in.space

聆英客服

B站

公众号

©转载内容版权归作者及来源网站所有,沪ICP备19038110号-1 技术支持:久鑫网络
的点点滴滴多多
取消
去登陆
会员权益
权益内容
注册用户
(免费)
基础会员
(199.00元/年)
尊享会员
(999.00元/年)

行业洞见

(可查看&可订阅)

品牌公开课

(每周更新一期,往期均可观看)

行业研究报告

(可下载,全年共100+份)

企业分析报告

(可下载,全年共40+份)

聆英智库

(可搜索&查看)

聆英月报

(可下载,全年共12期)

点击查看模板

新能源双月刊

(可下载,全年共6期)

点击查看模板

行业白皮书

(可下载,全年共4期)