目录

  • 1 导论:高科技与艺术的互动
    • 1.1 科学与艺术的定义
    • 1.2 高科技时代的艺术定位
    • 1.3 泛艺术时代的科技定位
    • 1.4 科技艺术一体化时代的历史演变
  • 2 人工智能生成内容概述
    • 2.1 创造内容与人工智能生成内容
    • 2.2 人工智能生成绘画
  • 3 人工智能艺术及其未来
    • 3.1 人工智能艺术之初体验
    • 3.2 人工智能艺术的理论解读
  • 4 人工智能绘画与设计师
    • 4.1 什么是AI绘画
    • 4.2 设计师与AI绘画工具的互动
    • 4.3 AIGC应用背景下设计师该如何革新
  • 5 虚拟数字人
    • 5.1 什么是虚拟数字人
    • 5.2 数字人发展概述
    • 5.3 数字人的典型特征及其制造过程
    • 5.4 数字人市场前景与应用价值
    • 5.5 虚拟数字人产业生态
  • 6 大模型时代的机遇与挑战
    • 6.1 重新认识知识
    • 6.2 重新认识变革
    • 6.3 重新认识设计
  • 7 人工智能艺术教育的观念与路径
    • 7.1 技术革命带来的观念变革
    • 7.2 人工智能技术让艺术回归意义
    • 7.3 人工智能对设计的加持
    • 7.4 创意与审美成为设计内核
    • 7.5 设计教育如何应对AIGC的变革
  • 8 生成式人工智能带来的绘画与设计变革
    • 8.1 AIGC对游戏行业的影响
    • 8.2 AIGC对设计类课程的影响——以游戏概念设计为例
    • 8.3 初步认识人工智能绘画
    • 8.4 人工智能绘画伴随的常见问题
  • 9 虚拟数字人3.0的核心技术框架
    • 9.1 主流技术架构
    • 9.2 基础软硬件支撑体系
    • 9.3 从0到1创建一个虚拟数字人
  • 10 元宇宙
    • 10.1 从Web1.0到Web3.0
    • 10.2 元宇宙的六大主要特征
  • 11 交流与分享
    • 11.1 生成式人工智能应用市场前景
    • 11.2 从计算机角度看AIGC
    • 11.3 AIGC与人工智能三要素
    • 11.4 百度文心一格AI绘图入门
    • 11.5 网易有道AI绘画测试
    • 11.6 AIGC应用背景下的设计教学思考
    • 11.7 人工智能与环境设计
  • 12 AIGC应用导论
    • 12.1 关于AI对话的一个思维工具
    • 12.2 什么是transformer
    • 12.3 什么是扩散模型?
    • 12.4 AI数据集是什么
数字人发展概述


数字人发展概述

文|王宏飞

数字人是当下的关注热点,是各大互联网公司发力的方向。数字人开始备受关注最先是因为微软的人工智能人“小冰”开始写现代诗,并受到大众传媒的关注进而引发热议。与常人不同,当时的小冰并不是主动写诗,而是根据一张照片进行创作。在这个过程中,照片中的色彩和内容会激发数据库开始计算,进而得到一种“印象”,这种印象再与数据库中的现代诗进行匹配,于是一首现代诗便形成了。

小冰写诗是对人脑的模拟。我们都知道,普通人写诗都是有感而发,这种感又来自视觉、听觉、嗅觉、触觉和味觉,这种感觉刺激了大脑,调动了大脑所储存的数据,进而大脑对数据进行重新组织,再结合人的想象,诗歌便出来了。诗人水平的高低往往取决于两点,一是诗人的感悟能力;二是诗人的表达能力。感悟能力即是联想和想象能力,这既关乎诗人的文学积累,也关乎诗人的人生阅历;表达能力,则是建立在学习基础之上的,通过学习诗人可以掌握诗歌表达的相关技巧。对人工智能而言,人工智能有记忆能力、有比较分析能力、有归纳整理能力,唯独缺少感悟能力,亦即联想和想象的能力。人工智能的感悟能力就是未来人工智能的研发方向,也是数字人研发最难的点。对人而言,情绪能激发创作,情绪受身体所分泌的各种物质的印象,而人工智能是无法分泌生物质物质的,所以人工智能的学习和思考是另一种逻辑,人工智能没有灵感乍现的时候,他们的思考本质是计算。人类思考虽然也是计算,但这种计算过程中存在各种偶然性,这种偶然性往往是最难能可贵、最能打动人的。

对普通人而言,生活中我们已经开始接触比较初级的数字人了,比如手机所携带的语音助手,无论是小爱、小度,还是sari,它们通过识别人类的语音,分析人类提出的问题,进而在数据库里为人类找到匹配问题的答案。另外一个比较常见的就是导航系统,一是分析路况,二是根据需求选择合适的路径,三是语音输出,这同计算器算算术题没有什么两样。较为独特的地方是数字人对语音的模仿,诸如模仿罗永浩是音色、模仿林志玲的声色,声音模仿是目前数字人做的最完美的地方。微软的小冰已经开始商业化应用,其中面向个人的一块就是数字人音乐,还出了专辑,当下零售价一般为2/ 首。

另一块数字人应用比较成熟的地方就是人工智能主导的图形图像设计。从事设计工作的人都能认识到,对一般的美术编辑工作而言,图文的排列所呈现的形式美是有规律的,诸如横向阵列、纵向阵列、对角线构图、形式呼应、重复与特异等设计手法。正是因为有规律,所以容易被人工智能所掌握,当下人工智能制作商品海报、设计画册已成为众多商家的日常应用,人工智能设计从事图文编排编辑工作所产生的设计效果能超越大多数普通设计师,关键是它所花费的时间更短。

数字人产业有着广阔的商业前景,能替代当下很多工作岗位,这也是为何资本愿意投入的重要原因。虚拟员工、虚拟代言人、虚拟学生已等虚拟数字人正愈发出现在公众视野。虚拟员工就是日常生活中接触到的欠费催收专员、运动裁判、语音接待机器人等,虚拟代言人有语音翻译、虚拟主持人、虚拟专家等。

此外,虚拟偶像也是各大商家的研究发力点,这一块主要是为大众生活提供文化娱乐。虚拟偶像不同于前文所描述的虚拟员工和虚拟代言人,虚拟偶像同现实生活中的明星一样,主要提供表演服务,只是虚拟偶像是技术驱动的媒介表演,它独立于任何单一的生命体和表演者的参照物而存在。事实上,虚拟数字人并不是新鲜概念,最早可追溯至 2007 年。当时,以语音合成程序为基础开发的音源库“初音未来”,成为首个现象级虚拟偶像。在此后相当长时间内,虚拟数字人大多以动漫、游戏形象为主,集中应用于影视娱乐产业。虚拟偶像的人设数据来自专业工和设计师的市场调查分析,其形象呈现建立在将数据人格形象化的基础之上,利用绘图渲染和虚拟成像技术定妆成型,最终借助动作捕捉技术使得虚拟偶像的“身体”在观看者看来具有了想象中的生命活力。

简单的总结一下,虚拟数字人就是融合了计算机视觉、语音识别等AI技术生成的形象,数字人做抉择的基础是数据库以及程序自身的深度学习。虚拟员工、虚拟主播、虚拟偶像是当下最具人气的数字人。对人而言,数字人可以借助语音和表情等人类容易感知、识别的形象同人类进行更良好的互动与沟通。虚拟数字人只是人工智能提供的一种让人类更舒适、体验更好的交互方式,是人机交互最表层的交互显现。毕竟,相比较萌宠和类人机器人,人类还是更愿意和具有人类形象特点和思维特点的类人机器人进行沟通,有一种人类想象中的情感温度。

从社会发展来说,数字人产业的发展扩大了社会治理的想象空间。这一点如同混沌之初,人类社会尚未建立秩序,而后因为各种灾难或磨难,人类建立了秩序,并依靠这种秩序、修正这种秩序来促进人类社会的发展。数字人作为一种新工具,它也为人类社会的治理带来了更大的想象空间。如果在未来,一切机械装置准备好之后,一切程序设定好之后,只要启动能源转换开关,整个系统就会自动运作。这一刻,多数人被少数人奴役,被迫从事生产资料的生产的时代是不是可以结束了?这也是一个有趣的问题。或许,人类会找到新的意义,然后用这种意义作为内驱动力。

王宏飞,20221110