亚马逊开发视觉化AI搜索模型,文字自动转图片,提升视觉搜索体验

蓝海亿观网/ 2022-03-07
1418
95

b2b亚马逊开发视觉化AI搜索模型,文字自动转图片,提升视觉搜索体验

亚马逊近日公布,开发了一款新的AI模型,可以把产品描述文字转换成图片,帮助消费者更好查找商品,提升视觉搜索体验。

利用GAN网络合成图片,使搜索体验更直观

亚马逊表示,这款AI模型运用GAN(生成式对抗网络),能够成功合成图片。GAN技术于2014年首次面世。

也就是说,亚马逊开发的这款“视觉化产品搜索AI模型”,主要功能是合成产品图片,所谓文字转图片,这里的图片不是卖家自己提供的产品实图,而是系统根据产品名称或title,自动合成的图片,为消费者查找商品提供更直观的视觉体验,帮助其更快找到心仪的产品。

蓝海亿观网了解到,这款AI新模型,不仅仅可以把搜索结果中的文字转换成图片,另外一个重要的新功能,就是在添加新的产品图片的同时,保留“旧”图片

举个例子,如果消费者搜索“women’s black pants(女士黑色裤子)”,在搜索结果中会出现相关产品,但原来的文字描述改为图片展示;在“women’s black pants”基础上,添加“capri(卡普里裤,又称为七分裤)”或“petite(小个子)”等其他搜索词,搜索结果会显示新的匹配图片,但之前搜索结果中的产品图片也保留。

除此之外,还有一个颜色模型,能够生成与颜色搜索词更加匹配的图片

该AI模型分两步合成图片,配有“长短时记忆”组件

据亚马逊所说,该“视觉化产品搜索AI模型”,已经在四个不同的系统上进行测试,而这四个系统都使用StackGAN,一种“文字转图片GAN”。

蓝海亿观网获悉,亚马逊新AI模型,是StackGAN的升级版,分两步生成图片。第一步,直接根据文字生成低分辨率图片;第二步,在生成的低分辨率图片基础上,合成更高清图片,有更细节的纹理和线条,产品颜色也更自然真实。

而且,新AI模型还添加了“长短时记忆”组件,简称LSTM。LSTM和GAN网络结合,能够保证消费者在搜索框中连续输入搜索词时,AI模型能够不断“精炼”对应的产品图,实现输入文字与合成图片高度匹配。(蓝海亿观网egainnews)文末扫码入群,对接跨境电商优质资源。不得擅自改写、转载、复制、裁剪和编辑全部或部分内容,请联系我们授权。

文章内容由作者创作,作者负责内容的真实性、准确性和合法性。出海易倡导尊重与保护知识产权,未经作者和/或本网站许可,不得复制、转载、或以其他方式使用本网站内容。如发现本站文章存在版权问题,烦请联系chuhaiyi@baidu.com,我们将及时核实处理。文章来源:蓝海亿观,本文为作者独立观点,不代表出海易立场。
优品推荐

填写询价