AI绘画的“小秘密”都在这一篇文章里******
有了AI,人人都可以是艺术家。AI绘画的出现,恰如瑞士艺术家保罗·克利所言:“艺术不是再现可见,而是使不可见成为可见。”经过20年左右的发展,目前基于不同类型或者模态元素的AI绘画发展情况不尽相同,发展最久的是“以图生图”,再到近期火爆的“文+图”生图。当然,也有团队已经研发出由语音生成图像的技术。
上传一张图片,或者输入一些简单的关键词,系统就能自动生成一张卡通图像……最近一段时间,AI绘画开始在互联网社交平台走红。
AI绘画,顾名思义就是利用人工智能进行绘画,是人工智能生成内容的典型应用场景之一。其主要原理是收集大量已有作品,通过算法对其内容和风格特征进行解析,最后再生成新的作品,所以算法是AI绘画的核心。
当前,“凭空”生成图像的AI绘画,其实也会动辄“翻车”:也许上一秒AI通过你的照片绘出的是一张充满艺术感的二次元画像,下一秒你的宠物猫、狗则可能被画成可爱少女或肌肉猛男。
事实上,AI绘画早已火爆全球。第一张公开展出的、由人工智能创作的绘画作品《埃德蒙·贝拉米的肖像》曾于2018年在佳士得拍卖行以43.25万美元成交,那是一张由机器学习了从14世纪到20世纪的1.5万张肖像画之后自动生成的一张肖像画作品。
AI绘画是如何实现“凭空”生图的?除了娱乐外,AI绘画还有哪些潜在的应用前景?
从“以图生图”到“语音生图”
2022年,由人工智能创作的《太空歌剧院》一度火出圈。在美国科罗拉多州举办的新兴数字艺术家竞赛中,《太空歌剧院》获得“数字艺术/数字修饰照片”类别一等奖。它的构图、配色以及画面的细节堪称精致。然而,这个作品的创作者不是艺术家,而是来自美国科罗拉多州的游戏设计师。
这位游戏设计师在一个名为“Midjourney”的AI创作工具里,先输入几个关键词,如光源、构图、氛围等,得到了100幅作品,再进行约80小时的修图修饰,最终选出3幅作品,最后把图像打印到画布上。
通过简单交互式对话在短时间内生成的“艺术”作品,让人类艺术家展开了一场关于“AI绘画作品参赛是否属于作弊”的争论。这场声势浩大的争论也令大众直观地意识到如今的AI绘画水平已经发展到了何种程度。
“人工智能在艺术方面的创作最早可以追溯到上个世纪末,当时的人工智能绘画技术叫作‘图像的风格化滤镜’。”中国科学院自动化研究所多模态人工智能系统全国重点实验室研究员董未名说,最初的AI绘画方法比较简单,比如一张普通的照片,通过一些图像处理的算法,把照片像素进行几何或者色彩上的变换,然后再调节不同参数,就可以模拟出类似油画或者水彩画的风格。
经过20年左右的发展,目前基于不同类型或者模态元素的AI绘画发展情况不尽相同,发展最久的是“以图生图”,再到近期火爆的“文+图”生图。当然,也有团队已经研发出由语音生成图像的技术。
AI绘画主要依靠三种技术模式实现
董未名介绍,目前AI绘画主要借助图像风格迁移技术、图文预训练模型和扩散模型实现。
“图像风格迁移技术指的是图像处理算法通过对输入的真实图像内容特征和对参考的艺术图像风格特征的提取,实现真实图像内容特征和艺术图像风格特征的融合,从而生成新的艺术图像。”董未名举例,如果将美国旧金山艺术宫的外景照片和印象派创始人莫奈绘制的作品,通过图像风格迁移技术进行融合,就能得到一张看起来像是由莫奈绘制的美国旧金山艺术宫的绘画作品。最初的AI绘画采用的正是这种技术。
不过,在董未名看来,图像风格迁移技术大多依赖的是生成式对抗网络(GAN)算法,它最大的问题是生成的绘画作品艺术性不强,笔触和构图让人觉得与真实的绘画有差距,所以长久以来,AI绘画一直“籍籍无名”。
当图像风格迁移技术还在挣扎于输出作品的审美问题时,图文预训练模型的出现,加速了AI绘画的崛起。
“依托图文预训练模型,只要输入一句话或者上传一幅风格明显的图片,算法就能将图像特征和文字特征‘对齐’。生成的绘画作品的内容特征和上传图片的内容相似,艺术性也比图像风格迁移技术生成的图片强很多。”董未名举例,比如支撑图文预训练模型的可对比语言—图像预训练(CLIP)算法,就是利用图文特征“对齐”的能力,再结合已有的生成模型,实现“以图生图”或者“图+文”生图。
不过,董未名坦言,图文预训练模型的推广也存在一些争议,有部分人认为,该模型在训练前期,需要用大量的图形处理器(GPU)进行数据训练,耗电量大、成本很高,而该模型的应用场景却不够清晰。但也有人认为,也许该模型未来可以打造为通用的人工智能模型,用它完成更多的算法作业,只是这还需要时间的验证。
诚然没有一项技术是完美的,这也为人类探究更先进的技术提供了无限动力。当下最流行的扩散模型便是其中之一。
“目前最新的AI绘画技术采用的就是扩散模型,这种模型可以把一个随机采样的噪声输入模型,然后尝试通过去噪来生成图像。”董未名表示,扩散模型也存在弱点,由于模型对图片内容识别的能力不足,或者难以完全理解识别文字的意义,以及训练数据的偏差,有时便会生成“四不像”的作品。此外,扩散模型生成图片的速度比较慢,目前还达不到实时生成图片。
互联网治理、元宇宙或潜藏应用前景
AI绘画目前的应用场景,更多聚焦于社交软件。近期在国内社交网络“火出天际”的AI绘画软件主要集中在小程序及App。随着AI绘画小程序的火爆,短视频平台抖音也迅速上线了AI绘画特效。同时,此前腾讯上线了“QQ小世界AI画匠”活动,百度也推出了首款AI艺术和创意辅助平台“文心一格”。
有了AI,人人都可以是艺术家。AI绘画的出现,恰如瑞士艺术家保罗·克利所言:“艺术不是再现可见,而是使不可见成为可见。”“AI现在已经完美实现了这一目标,人们可以通过机器计算来绘制出很多现实中见不到的场景。”董未名畅想,不远的将来,AI绘画或许还将展现更丰富的应用场景。
“现在网络上充斥着很多不良内容,这些内容为了逃避监管经常以绘画的形式出现,而当前很多内容识别模型对真实图片识别得很准确,但缺乏不良内容艺术作品的相关训练数据,所以对不良内容识别不准确。也许可以用AI绘画技术,积累不良内容艺术作品的数据,并用以训练识别模型,以提升互联网内容的安全监管能力和识别的准确率。”董未名建议。
在董未名看来,作为一种艺术呈现形式,AI绘画也将在元宇宙、设计、文旅等行业催生新的商业模式。例如AI绘画目前在AI辅助创作、短视频、影视制作和元宇宙等方面都有布局,因为这些赛道都离不开创意,AI绘画可以帮助创作者通过简单的特征输入,实现对其创意的预览,甚至可以直接进行创作。
不过,董未名并不讳言,当下AI绘画仍然存在版权争议问题。AI绘画的核心是模型,而训练模型需要使用大量图像、文本数据。对于未经授权的图片,经过运算之后所生成的图像版权归属尚难界定。“有的画家风格特别明显,如果用画家的画去训练算法模型生成作品,那最后的版权属于谁呢?”董未名提出的问题,正是多数AI绘画作品所面临的现实问题。
AI绘画掀起了一场资本的群体狂欢,希望有一天它能走出“照猫画虎”的尴尬,真正服务艺术创作、创造更多价值。(科技日报记者 金凤)
中国新观察|这项国际标准,为何由中国牵头?******
中新网10月17日电(中新财经 葛成)据中国工业和信息化部消息,2022年10月,由中国牵头制定的首个自动驾驶测试场景领域国际标准ISO 34501《道路车辆自动驾驶系统测试场景词汇》正式发布。
ISO 34501主要规范了自动驾驶系统、动态驾驶任务、设计运行范围及条件等概念,明确了场景、动静态环境和实体要素之间的关系,并形成了包括功能场景、抽象场景、逻辑场景和具体场景在内的场景层次描述规则。
ISO 34501为何由中国牵头?该标准的发布在全球范围内将有哪些重要意义?对推动全球和中国自动驾驶技术的发展带来哪些影响?
对此,中新网“中国新观察”栏目采访了国际标准化组织道路车辆委员会自动驾驶测试场景工作组(ISO/TC22/SC33/WG9)召集人、中国汽车技术研究中心有限公司标准化研究所所长王兆,ISO34501测试场景标准牵头起草人、中国汽车技术研究中心有限公司标准化研究所智能网联部部长孙航。
访谈实录摘编如下:
中新网:自动驾驶的系列国际标准制订中,中国负责组建自动驾驶测试场景工作组(ISO/TC22/SC33/WG9)并担任工作组召集人和首个标准的牵头起草人,为何是中国?这需要满足哪些条件?
王兆:2018年4月,中国向国际标准化组织道路车辆委员会(ISO/TC22)提出自动驾驶测试场景国际标准提案,随后获批组建自动驾驶测试场景工作组(ISO/TC22/SC33/WG9)并担任工作组召集人。
首先,工作组的成立源于我国汽车行业前期向国际标准化做出贡献的良好基础和意愿。近年来,在工业和信息化部、国家标准化管理委员会领导下,我国汽车行业主持制定了安全玻璃、电动汽车安全及换电系统等国际标准和全球技术法规,参与联合国世界车辆法规协调论坛(UN WP.29)、国际标准化组织(ISO)、国际电工委员会(IEC)重点领域全球技术法规协调以及国际标准制定近40项,我国专家在参与国际标准法规过程中展现出的专业精神和积极态度为中国在国际标准法规组织内建立了良好的口碑。因此,我们向汽车行业的国际标准法规组织主动做出的中国贡献是得到国际认可的。
其次,这得益于我国智能网联汽车产业发展成果在国际上产生的影响力。近年来,我国智能网联汽车应用场景不断丰富、技术创新展现出巨大活力,国内汽车行业在智能网联整车及关键系统部件研发、基础场景库构建、道路测试与示范应用等方面等领域积累了大量实践经验,总体在国际上处于第一梯队的位置。这样的发展成就一方面服务了国内人民群众对于智慧出行的需求,另一方面也提升了我国在全球自动驾驶产业融合发展方面的知名度和影响力。因此,我们在国际上以召集人身份组织自动驾驶测试场景的标准体系规划工作是有产业实践基础的。
最后,还得归功于我国汽车行业技术专家对产业发展需求和趋势的准确把握。随着汽车自动驾驶技术在全球的迅速兴起,自动驾驶测试评价技术受到世界各国及国际组织的重点关注。我国汽车行业的标准化专家在技术酝酿初期就敏锐洞察到了这一发展趋势,做出了“测试场景”将成为自动驾驶测试评价核心基础要素和关键技术难点的判断。随后,我们在国内组织60余名技术专家组成“自动驾驶测试场景国际标准制定支撑专家组”,通过广泛调研、研究测试场景生成及应用关键技术并共同编写学术专著等,形成了符合我国交通场景特征的技术方案。基于系统研究形成的“中国方案”保证了我们技术提案的科学性和竞争力,也为国际标准化组织和相关国家对中国担任召集人提供了更多信心。因此,我们以牵头起草人身份开展测试场景基础类标准的制定也是有技术积累作为保障的。
中新网:国际标准ISO 34501正式发布在全球范围内具有哪些重要意义?在标准推动下,L3(有条件自动驾驶)甚至L4(高度自动驾驶)级别自动驾驶技术会更快实现应用吗?
孙航:ISO 34501是国际标准化组织发布的第一个自动驾驶测试场景国际标准,该标准是自动驾驶领域重要的术语定义类基础标准,能够满足各国在开展自动驾驶测试评价相关工作时采用标准化语言描述测试场景的需求。
该标准将会广泛应用于全球智能网联汽车自动驾驶技术及产品的研发、测试和管理,为智慧出行、区域接驳及道路运输等各类自动驾驶应用提供重要基础支撑。
L3(有条件自动驾驶)级和L4(高度自动驾驶)级别的自动驾驶本质上是由系统或机器代替人类完成部分或全部的驾驶任务。自动驾驶条件下,国际普遍采用的基于特定条件、特定指标的传统汽车测试评价方法,已无法满足自动驾驶汽车测试评价需要,需要建立基于复杂测试场景的新型测试评价体系,这意味“场景”将成为自动驾驶测试评价的核心基础要素和关键技术难点。ISO自动驾驶测试场景系列标准无疑将有助于促进高级别自动驾驶更快地由实验室走向区域性示范应用,并最终实现规模化商业落地。
实际上,自动驾驶技术已经在我国一些城市的限定区域内实现了共享出行、区域接驳、快递配送和专线物流等场景方面的初步应用。当然,这项复杂技术的规模化应用并非易事,依赖于包括技术标准在内的一整套技术创新和治理体系的建立,如法律法规的健全、技术水平的提升和商业模式的成熟等。
中新网:国际标准ISO 34501将解决目前自动驾驶技术发展中的哪些问题?对推动全球和中国自动驾驶技术的发展带来哪些影响?
孙航:应用技术的发展通常会历经从简单到复杂、从基础性建设到创新性突破的过程,智能网联汽车的自动驾驶技术发展也不例外。自动驾驶测试场景作为全球范围内的一项新兴技术,如果在通用术语、逻辑架构和要素关系等基础性定义方面没有统一的“语言”,对基于场景的产品研发、测试评价乃至行业管理的实施都是十分不利的。
在标准制定初期,仅“场景”一词的定义就有德国PAGASUS、英国MUSICC、美国SAE、日本SAKURA及我国产业界使用的十余个版本,此外,ISO 21448预期功能安全、ASAM OpenX标准也分别给出了与测试场景相关的不同定义。如果全球主要汽车产业国家在这方面“各说各话”,显然是不利于智能网联汽车产业融合发展的。ISO 34501相当于编制了一部自动驾驶测试场景领域的“字典”,通过国际标准的形式统一了场景相关的27个关键术语和定义。
该标准的术语横向覆盖了从场景采集、分析到应用、迭代的场景全生命周期工程流程,为自动驾驶上下游产业链的紧密衔接与融合创造了基础条件;同时也纵向贯穿了场景技术产品开发者、应用者和管理者等几个层面,为各相关方建立统一理解和认识搭建了桥梁。这将极大地提升我国自动驾驶产业链内部沟通效率和多国产业间的合作成效,为降低融合创新成本、促进产业投融资和推动汽车全球化贸易往来提供重要的基础性支撑。
2022年7月20日起,北京的自动驾驶出租车迎来主驾无人、副驾有安全员的商业化试点阶段。 北京市经开区管委会供图中新网:据了解,国际标准ISO 34501只是自动驾驶测试场景系列国际标准项目中的一个,下一步还要重点做好哪些标准的制定工作?
王兆:自2018年测试场景工作组成立以来,中国联合德国、日本、英国、荷兰、美国等二十余个国家的专家共同规划了自动驾驶测试场景体系,包括ISO 34501场景词汇、ISO 34502安全评估框架、ISO 34503设计运行范围、ISO 34504场景分类、以及ISO 34505评价与用例生成等一系列国际标准项目。
除了本次发布的ISO 34501,同样是由中国联合德国牵头的ISO 34505于今年9月份刚刚完成立项,由日本和德国牵头、中国深度参与的ISO 34502有望于近期正式发布,测试场景系列中的其他标准项目尚处于起草过程中。
除了推动场景系列标准制定外,我国还深度参与了国际标准化组织范畴内的汽车信息安全、软件升级、功能安全、预期功能安全等10余项智能网联汽车领域国际标准的编制,下一步还将重点推动车载操作系统、激光/毫米波雷达、电磁兼容等国际标准的立项、起草工作,并将适时开展国内国际标准之间的转化和评估。
未来我国将整合国内优势资源,依托汽车产业对话机制与标准化合作框架,加强与主要汽车产业国家及“一带一路”沿线国家的交流合作,同时还将充分发挥我国汽车产业规模效应和应用生态优势,秉承“开放、合作、融入、贡献”的原则,推动智能网联汽车标准“走出去”,提升中国汽车标准国际影响力和贡献度。总之,我国汽车行业将继续作为国际标准的参与者,并争取成为更重要的贡献者。
2022年4月30日,广州市首批自动驾驶便民线正式开放载客测试。图为自动驾驶巴士行驶在阅江西路上。 中新社记者 陈骥旻 摄中新网:未来,我国在智能网联汽车标准体系建设和产业融合发展方面将有什么样的前景?
王兆:2017年起,工业和信息化部、公安部、交通运输部等联合国家市场监督管理总局陆续发布了《国家车联网产业标准体系建设指南》中的总体要求、智能网联汽车、信息通信、电子产品与服务、车辆智能管理、智能交通等各个部分,我国车联网产业标准体系建设方案的总体蓝图已经绘制完成。
作为总体指南体系中率先发布的部分,我国智能网联汽车标准体系的建设积极践行《国家标准化发展纲要》要求,第一阶段建设目标已顺利完成,目前报批发布相关标准39项,完成草案编制及立项标准项目42项,总体标准自主供给率达到50%以上,为智能网联汽车行业管理和产业高质量发展提供了重要的技术支撑和基础保障。同时,为适应我国智能网联汽车发展的新形势和新需求,新一阶段的智能网联汽车标准体系建设方案已经起草完成,正在面向社会公开征求意见。新的标准体系将以“三横两纵”核心技术架构为基础,面向2025、2030年两个阶段性目标开展140余项标准的制定工作。
未来,智能网联汽车标准体系的建成将服务于我国汽车行业电动化、智能化、网联化浪潮下产业融合发展需求。在新的形势下,通信、电子及互联网等相关企业将自己在数字化、信息化等方面的能力向汽车行业延伸。在产业融合过程中,互联网企业已逐渐认识到汽车行业“固定资产重、投资门槛高、产业链关联性强”等特点;而在技术、经验、品牌等方面具备先天优势的传统车企,也开始运用新兴科技企业的“互联网”思维;我们更要清醒地认识到,我国在产业链方面仍存在部分关键技术缺失、操作系统、核心元器件依赖进口等“大而不强”等问题。智能网联汽车及相关车联网标准体系的建设为产业融合发展构建了基础,围绕汽车建立的产业集群将继续以标准为引领,将实践中凝结的“中国智慧和方案”汇聚到发展浪潮之中,促进智能网联汽车产业“双循环”高质量发展,加速实现由汽车大国迈向汽车强国的伟大愿景,为国际标准化事业及国际汽车产业可持续长远发展作出中国贡献。(完)
(文图:赵筱尘 巫邓炎) [责编:天天中] 阅读剩余全文() |