正文
巨头动作不断,AI最新发力点是它!
作者:股掌柜证券咨询 2023-05-11
今天,指数继续分化,沪指表现相对较弱,市场氛围有所回暖。

今天,指数继续分化,沪指表现相对较弱,市场氛围有所回暖。

 

板块方面,中特估继续走弱,今天不但没有回流反而出现补跌。虽然补跌过后很容易出现一次集体反弹,但在这个阶段就全面补跌还是大大低于预期,整体走势有点类似于去年11月的房地产,最近的超预期调整对人气打击非常大,后面很难再吸引追涨资金参与,如果资金不追涨自然就没有高度和持续性。

 

而AI却迎来明显反弹,AI+应用表现突出,算力和大模型相对偏弱,传媒娱乐方向高潮明显,特别是影视板块指数大涨近8%,不过跟风上涨的电魂网络出现炸板可能意味着应用端已经出现高点。 

站在当前节点来看,中特估目前人气受挫,资金暂时还是会去攻击AI或者半导体这块。其中最近AI又有一个新概念出来:向量数据库

 

首先,随着大模型带来的应用需求提升,4月以来多家海外知名向量数据库创业企业传出融资喜讯:

 

4月28日,向量数据库平台Pinecone宣布获得1亿美元(约7亿元)B轮融资。

4月22日,向量数据库平台Weaviate宣布获得5000万美元(约3.5亿元)B轮融资。

4月6日Chroma获1800万美元种子轮融资,4月19日Qdrant获750万美元种子轮融资。

 

其次龙头股表现优异,龙头A股星环科技、北交所云创数据等股价连续异动,其中云创数据自底部以来股价已接近翻倍。

 

一.向量数据库究竟是什么呢?

 

AI 时代一切AI化,而AI化的本质则是向量化。向量化计算成本高昂,海量的高维向量势必需要专门的数据库进行存储和处理。于是,向量数据库应运而生。向量数据库在拓展AI全新应用场景的同时,也将对传统数据库产品形成替代,进而成为AI时代的Killer App。

 

向量数据库是一种专门用来存储和查询向量的数据库,主要应用于人工智能、机器学习、数据挖掘等领域。

 

同传统数据库相比,向量数据库不仅能够完成基本的CRUD(添加、读取查询、更新、删除)、元数据过滤、水平缩放等操作,还能够对向量数据进行更快速的相似性搜索,商业价值提升明显。

 

目前AI主流的大模型如Transformer、Clip、GPT等均能够将文本、图像等非结构化数据转化为高维向量,而伴随大模型应用场景的扩展,这些高维向量数据的存储、检索将显著带动向量数据库的市场需求。

 

二.向量数据库的作用是什么?

 

1.向量数据库可以大幅度拓展大模型的时间边界和空间边界。

 

向量数据库一个很重要的功能是拓展大模型的边界,分为时间边界和空间边界。时间边界的扩展指的是向量数据库能够使得大模型LLM拥有“长期记忆”。空间边界的扩展指的是向量数据库能够协助解决目前企业界最担忧的大模型泄露隐私的问题。

 

目前大模型都是预训练模型,对于训练截止日之后发生的事情一无所知。向量数据库可以通过存储最新信息后给大模型访问来弥补这点不足。

 

比如向量数据库本地部署后可以存储企业有关的大量隐私数据,在本地部署或者专有云部署大模型后,通过特别的Agent大模型可以在有保护的情况下访问向量数据库的隐私数据,进而可以在不向外网暴露公司的隐私的情况下,使得公司的业务得到大模型的助力。

 

2.向量数据库自带多模态功能

 

向量数据库自带多模态功能,一个典型的应用场景是多语言搜索,向量数据库支持跨语言的信息检索,用户可以使用英语、法语、中文等多种语言搜索图书库,而无需事先对书名进行多语言翻译处理。

 

再者,即使不考虑需要LLM支持的边界拓展型应用和多模态搜索,近似搜索功能就可以给向量数据库带来巨大的商业化潜力。比如推荐系统、图像检索、语音识别和处理、生物信息学等。

 

向量数据库的近似搜索能力能够给向量数据库带来巨大的商业化潜力。比如Tokopedia就已经部署了向量数据库进行近似搜索,提升了10x智能化水平。

 

三.向量数据库市场空间究竟有多大?

 

在互联网化趋势下,数据量呈爆炸式增长。据Stastista,预计2025年数据量将达到181ZB。

 

数据量的爆发式增长为数据存储、处理带来更为庞大的需求。因此,向量数据库市场空间巨大。不过向量数据库目前处于从0-1阶段,预测到2030年,全球向量数据库市场规模有望达到500亿美元,国内向量数据库市场规模将超600亿人民币,增长空间巨大,值得留意。

返回顶部