迎接AIGC:掌握隐空间(一)

发布时间:2023-01-17  


本文引用地址:

1   前言

上一期里我们曾经谈到AI 有3 种型:识别型AI、生成型AI、决策型AI。一般而言,2020 年之前,识别型AI 是主流;而在2020 年之后,生成型AI 和决策型AI 逐渐蔚为主流。尤其是生成型AI 模型,如长江后浪前浪,蒸蒸日上。

因之,本期就来谈谈生成型AI( 例如AIGC) 的魅力源头:隐空间(Latent space)。愈擅长于操作隐空间向量(Vector),就愈能生成令人惊讶的创作。现在,我们就来认识隐空间,建立扎实的基础,以便顺畅迎向AIGC新潮流。

2   复习AI基础概念:特征

大家都知道,科学素养是从“观察”开始。观察是认识现象( 如事物) 的起点,也是智力活动的泉源。观察的目的主要是为了了解事物外部形态和特征。包括区分事物的一般特征(Feature)、发现事物的内在本质特征等,并且加以记录,并对结果进行描述和对比分析,以便提出新问题,进行创造性的活动。

简而言之,人们对于周遭的问题或事件常可由不同的角度来观察或看出不同的特征。所谓特征,就是一件事物或一群事物,其具有与众不同的特色或表征。例如,人们在辨别其他人的长相时,常常会观察对方的脸形、眼神、嘴巴、发型等特征来区分和判断,只要记住对方独特的长相特征就可以,不必记忆其他细节了。这是人们天赋的观察和萃取特征的能力。再如,当您一大早从家里出门时,常常会先观察天气的特征:“乌云密布”,或是“阳光普照”。这也是天赋特征萃取能力的表现。

了解了特征的意义之后,就可以近一步观察到,特征与特征之间的可能存在有相互之间的关联性,这又称为:相关性(Correlation)。例如,当我们观察到天气呈现了一个特征:高空上乌云密布;这时也常常会发现另一个特征:低空中蜻蜓纷飞。而且可能还会发现第3 项特征:快下雨了。

由于您观察到了这3 项特征:“乌云密布”、“蜻蜓纷飞”和“快下雨了”。您就会赶紧采取行动,例如:赶快去收衣服,以免被淋湿了。所以这3 项特征与您的行动之间,也具有紧密的关联性。

3   以人脸特征为例

刚才提到了,人们在辨别其他人的长相时,常常会观察对方的脸形、眼神、嘴巴、头发的形状、位置、颜色等特征来区分和判断。其中,最简单的就是找出人脸的脸框(Box) 位置,以及其脸部关键点(Landmark) 的位置,例如眼睛,鼻子,嘴巴等位置坐标。例如,有一张图像,里面有两张人脸( 图1)。

1673921140391607.png

图1

请您按下“萃取脸部关键点”按钮,这Excel 画面就会调用幕后的Python 程序,来萃取各关键点的坐标(图2)。

1673921198442230.png

图2

图2 里显示出两张脸的脸框和关键点特征。其中,男生脸框的左上角坐标为(32, 67),且右下角坐标为(78,126)。而女生脸框的左上角坐标为(274, 52),且右下角坐标为(320, 112)。接着来看看女生的脸部各关键点特征。

第1 点:脸部的左边眼睛坐标为(289, 77)。

第2 点:右边眼睛坐标为(311, 76)。

第3 点:鼻子坐标为(301, 90)。

第4 点:嘴左角坐标为(290, 99)。

第5 点:嘴右角坐标为(310, 98)。

4   复习:空间映射的概念

在本专栏的前几期里,已经介绍过空间映射(Space Mapping) 的概念,及其在机器学习的重要功能。请您先复习本专栏第3 期的内容:《ML( 机器学习):理解空间对映观念》。在这里,简单复习这项AI( 机器学习)的核心概念和技术。

当人类看到自然空间的实际事物,收集这些事物的特征,提供给AI。而AI 则透过这些( 训练) 数据来( 间接) 观察实际事物。这些X 数据则成为X 空间里的坐标,来观察自然空间里实际事物之间的关联性( 图3)。

1673921359697911.png

图3

然后,AI 会很聪明地探索出两个空间的对映关系(图4)。

1673921386674238.png

图4

人们会在其生活的自然( 实物) 空间里,对其所感兴趣的各项事物,并收集其特征,就成为各笔原始资料(Raw data),各对映到X 空间里的一点。然后再映射( 过滤) 到Y 空间;还可再从Y 空间映射( 过滤) 到Z 空间。而ML 的魅力就是它很擅长于探索出对映的规律性。在AI 里,通常会将上述的空间,区分为两种:可观察空间(Observable space) 和隐( 藏) 空间(Latent space)。

5   认识可观察空间

兹举一个最简单的范例来说明之。这里有5 只兔和猫,各收集其两项特征:耳朵长度与尾巴长度。于是总共收集了5 笔原始数据(Raw data)。现在,就来把它们各对映到可观察空间里的一个点,而且两项特征各对映到一个维度( 轴)。也就是,每一笔数据各对映到2 维(2-Dimension) 的坐标空间里的一个点( 图5)。

1673921511636606.png

图5

由于这个空间的每个维度的意义很明确,人人都可以理解。因此,每一个点所带的含意,是类类可以理解的。它是人类可以观察其含意的空间,就称为:可观察空间。

同样地,这里有3 张脸( 即3 笔数据),含有其脸框和关键点的坐标,以及各有14 项特征( 图6)。

1673921590421437.png

图6

现在,就来把这3 张脸( 即3 笔数据) 各对映到可观察空间里的一个点,而且14 项特征各对映到一个维度( 轴)。也就是, 每一笔数据各对映到14 维(14-Dimension) 的坐标空间里的一个点( 图7)。

1673921645493534.png

图7

由于这个空间的每个维度的意义很明确,人人都可以理解。因此,每一个点所带的含意,是类类可以理解的。它是人类可以观察其含意的空间,就称为:可观察空间。

6   结束语

俗语说:从有招到无招。又说:无招胜有招。这里介绍的“可观察空间”可以说是有招的空间,人类可以理解空间各数据的含意。那么相对地,无招的空间就是“隐空间”,它是AI 创造出来的数据空间,人类就无法理解其数据的真实含意,所以称为:隐空间。

由于篇幅的关系,我们下一期就从有招到无招,将详细介绍神秘的隐空间,它是千变万化AIGC 创作魅力的源头。

(本文来源于《电子产品世界》杂志2023年1月期)

文章来源于:电子产品世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    隐空间蕴育AI生态架构之美;本文引用地址:1 前言 在本专栏的《从隐空间看AIGC的未来发展》文章里,曾经提到了,近年来AIGC 领域已经进入到大语言模型(LLM) 架构& 多模......
    细观Diffusion隐空间里UNet的训练流程(一);在上一期里,您已经领会Encoder 和Decoder 两者的涵意和功能了。请您看看图1 里,在两者之间有个空间,通称为:隐空间(latent......
    从NN神经网络理解隐空间;本文引用地址:1   复习:创作力来源—— 在2023 年1 月刊连载中,我们曾经说明在领域里,最近几个很红的图像模型,例如DALLE、Imagen 和Midjourney......
    如何设计容器来实践AI模型的PnP;本文引用地址:1 前言 在本专栏的前面文章《从隐空间看AIGC 的未来发展》里,曾经提到了,今天全球AIGC 产业即将进入产业的革命性的转折点,也逐渐浮现AI......
    迎接AIGC:掌握隐空间(一);本文引用地址:1   前言 上一期里我们曾经谈到AI 有3 种型:识别型AI、生成型AI、决策型AI。一般而言,2020 年之前,识别型AI 是主流;而在2020......
    拿大模型代码来训练自用小模型;本文引用地址:1 前言 上一期所刊登的《从CLIP 应用领会隐空间的魅力》一文里,就是一个典型的范例:从Github 网页下载OpenAI 公司的CLIP 源代......
    说只要能传输数据的通信口都能实现IAP的功能。 本文结合STM32官网提供的例程,利用UART在应用编程(IAP)。 2ST官网IAP例程 ST官网提供的IAP例程有很多很多,比如: 库:有使......
    的视区会变透明,让用户可以看见这个人,同时走近的人也会看到用户的眼睛。此外,当用户沉浸于空间环境或者使用App的时候,EyeSight会提供视觉线索,让他人知道用户在专注做什么。 目前......
    也重申了苹果在线下零售店单独出售 Vision Pro 头显的计划,这是因为苹果可以为购买者提供量身定制的头带及处方镜片,而第三方经销商无法提供这些产品,“堆积数百个 SKU 将占用很大一部分空间,并带......
    程序的环节。(内部复杂的代码原理,有兴趣的去机智云官网学习,这里只是教大家怎么用,以最快的速度做出自己想要的毕设) 3.1机智云能够根据我们刚才制作的APP,自动生成APP与STM32通讯......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>