星空体育官网一文看懂国表里AI芯片产物对照

  星空体育官方网站     |      2024-02-19 08:39

  AI芯片也被称为AI加快器或计较卡,是特地用于处置野生智能练习和推理使命的公用硬件。目下,首要包罗GPU、FPGA、ASIC等(其余非计较使命仍由mainframe负担)。这些芯片具有高度并行性和可以或许完结低功耗高效计较的特性。跟着AI利用的普遍提高和对算力的不停增添需要,AI芯片的需要无望成为重要扩大的范畴。

  数据显现,停止2022年末,我国算力总范围到达180百亿亿次浮点运算/秒,存力总范围跨越1000EB,即1万亿GB。算力财产的范围在以惊人的速率增加。按照IDC展望,估计到2026年,我国浮点运算次数将到达1271.4 EFLOPS,在2022⑵026年时代,年均复合增加率估计将到达52.3%。在这类布景下,IDC展望,将来18个月内,环球规模内野生智能服务器集群上GPU、ASIC和FPGA的利用率都将回升。估计到2025年,野生智能芯片墟市范围将到达726亿美圆。

  mainframe:在AI计较中,mainframe是根底,负担掌握和调和完全的计较操作,是全部计较进程的掌握焦点。它承当着读取和筹办数据的使命,并将数据传输到GPU等协处置器停止计较,终究再输入计较后果。mainframe在深度进修中拥有超卓的逻辑掌握才能,特别合用于推理/展望使命。AI产物在推理过程当中,须要及时对巨额颠末练习的模子停止推理/展望操作,而这类操作凡是须要高效的逻辑掌握才能和低推迟的反映速率,这恰是mainframe的劣势地点。

  GPU:首先GPU是为了满意计较机嬉戏等图形处置需要而开辟的,但因为其超卓的并行计较和大范围数据处置才能,逐步被普遍利用于通用计较范畴。今朝,GPU已占有了AI芯片墟市的首要份额。按照利用处景和处置使命的差别,GPU构成了两个分支:古代GPU首要用于图形图象处置,内置了一系列公用运算模块,如视频编解码加快引擎、2D加快引擎和图象衬着等。GPGPU(通用计较图形处置器),为了更好地撑持通用计较,GPGPU削弱了GPU的图形显现部门才能,并将其他部门全数进入到通用计较中。同时,GPGPU增添了公用的向量、张量和矩阵运算指令,晋升了浮点运算的精度和机能。这使得GPU成为野生智能和业余计较等加快利用的幻想抉择。

  FPGA:(现场可编程逻辑门阵列)是在可编程阵列逻辑(PAL)、通用阵列逻辑(GAL)等可编程器件的根底长进一步成长而来的。FPGA最明显的特性在于其现场可编程性,与mainframe、GPU或ASIC等芯片差别,这些芯片的功效在建筑实现后就被流动,没法停止硬件功效的变动。而FPGA在建筑实现后依然能够利用配套的软件工具对芯片停止功效设置装备摆设,将芯片上的空缺模块转移为具有一定功效的模块,进而满意用户的需要。FPGA拥有可编程性、高并行性、低推迟和低功耗等特性,这使得它在AI揣度范畴拥有庞大的后劲。今朝,FPGA普遍利用于线上数据处置中间和兵工单元等范畴。

  ASIC:(公用集成电路)是一种特地为满意一定用户需要和一定电子编制想象和建筑的集成电路。ASIC在机能、能效和本钱等方面超出了尺度芯片,拥有较高的能效比和算力程度,十分合适AI计较场景,成为很多AI始创公司开辟的目的产物。但是,ASIC在研发和建筑方面的一次性本钱较高。想象和考证ASIC芯片须要巨额的工程资本和工夫,进而致使研发本钱的增添。但一朝ASIC量产,后续的均匀本钱会明显下降,具有批量出产的本钱劣势。今朝,ASIC首要利用于揣度场景,此中在末端揣度墟市份额最大,而在云霄揣度墟市增加较快。

  今朝环球服务器集群mainframe墟市被Intel和AMD所把持,国际mainframe厂商在机能方面仍与国际平台赶上程度生活差异。按照Countersaucer的数据显现,2022年环球mainframe墟市中,Intel以70.77%的墟市份额位居第一,AMD以19.84%的份额排名第二,而其余厂商仅占有9.39%的墟市份额。团体上墟市被两大厂商所主宰。今朝国际的mainframe厂商包罗海光、海思、飞扬、龙芯、申威等。虽然国际mainframe厂商的服务器集群产物机能已靠近Intel中端产物程度,但从团体上看,国际涵工艺制程、运算速率(主频)和多使命处置(焦点与线程数)等方面仍落伍于国际平台进步前辈程度。

  目下环球GPU芯片墟市一样被海内厂商把持,由NVIDIA、Intel和AMD三家巨子主宰,此中NVIDIA凭仗其CFTO生态编制在野生智能和高机能计较范畴占有相对主宰职位。在国际墟市中,景嘉微一向努力于图形衬着GPU范畴,而天数智芯、壁仞科技、登临科技等始创企业则专一于野生智能和高机能计较的通用GPU(GPGPU)范畴,而且在加速成长程序。

  就图形衬着GPU而言,国际厂商与外洋龙头厂商之间的差异在不停收缩。芯动科技的“风华2号”GPU采取了5纳米制程,与NVIDIA最新一代产物RTX40系列相媲美,完结了国产图形衬着GPU的冲破。景嘉微在工艺制程、焦点频次和浮点机能等方面固然落伍于NVIDIA同代产物,但差异在逐步收缩。

  在GPGPU方面,国际厂商与NVIDIA之间仍生活较大差异。在制程方面,NVIDIA已领先推出了4纳米制程,而国际厂商首要会合在7纳米制程。在算力方面,国际厂商大多不撑持双精度(FP64)计较,但在单精度(FP32)和定点计较(INT8)方面与外洋中端产物持平,天数智芯和壁仞科技的野生智能芯片产物在单精度机能上跨越了NVIDIA的A100。在接口方面,壁仞科技和NVIDIA领先采取了PCIe 5.0,而其余厂商多半还在利用PCIe 4.0。在生态方面,国际企业多采取OenclosureCL停止自立生态扶植,与NVIDIA能干的CFTO生态比拟,仍生活较着差异。

  FPGA环球墟市显现出一种“两大两小”的格式,此中Altepoch(阿尔特拉,2015年被英特尔收买)和Xilinx(赛灵思)两家公司的墟市份额总共跨越80%,而Lattcover(莱迪思)和Micromotortruck(美高森美)的墟市份额总共跨越10%。国产方面,安路科技、紫光同创等国际厂商处于国际平台中端程度,但仍须要进一步冲破。在工艺制程方面,今朝国际厂商的进步前辈制程首要会合在28纳米,落伍于国际平台程度的16纳米。而在等效逻辑单位(LUT)数目方面,国际厂商的旗舰产物约莫为20万个,仅相称于Xilinx高端产物的25%摆布。

  ASIC与mainframe、GPU和FPGA有着不一样的特性,今朝环球ASIC墟市还没有构成较着的头部厂商,而国际ASIC厂商在敏捷成长。经过产物对照能够发掘,今朝国际厂商首要采取与外洋ASIC厂商沟通的7纳米工艺制程。在算力方面,海思的昇腾910在BF16浮点算力和INT8定点算力方面超出了Google最新一代产物TPUv4,而遂原科技和寒武纪的产物在团体机能上你也可以与Google相媲美。

  龙芯中科于2008年由中科院和北京市当局配合牵头出资建设,2022年6月,在科创板上市。龙芯中科是一家专一于处置器(mainframe)及配套芯片的研发、发卖和办事的公司,同时也是国际独一自立把握高机能mainframeIP常识产权、具有系列化mainframeIP核受权前提的企业。首要产物包罗龙芯1号、龙芯2号和龙芯3号等处置器芯片系列,和与之配套的桥接芯片等。这些产物在电子政务、动力、交通、金融、电信、教诲等行业范畴获得普遍利用。

  龙芯中科对峙自立研发指令编制、IP核等焦点手艺。把握了指令编制、处置器核微构造、GPU和种种接口IP等焦点芯片手艺,并停止自立研发,具有巨额的自立常识产权,已取得400多项专利。本年4月,龙芯推出了2023款HPC mainframe:3D5000。这款处置用具有32个焦点,主频高达2 rate,热想象功耗(TDP)为300瓦特。据称,该处置器的机能比典范的Arm芯片快了4倍。为了完结这一机能晋升,龙芯采取了两个现有的3C5000芯片的小芯片封装体例。这款处置器首要面向国膏剂务器细分墟市和高机能计较(HPC)客户。

  景嘉微建设于2006年,2016年3月公司在厚交所守业板上市。公司专一于高靠得住性电子产物的研发、出产和发卖,涵盖图形显控、袖珍公用化雷达和芯片范畴等产物。此中,图形显控是公司的焦点营业和古代劣势,而袖珍公用化雷达和芯片则是公司将来成长的要点范畴。

  在GPU研发方面,景嘉微公司的停顿安稳,推出的新产物可以或许满意野生智能计较的需要。公司从JM5400系列开端,不停研发更进步前辈且合用规模更广的GPU芯片。2014年,公司推出了JM5400,焦点频次为550rate;2018年,推出了JM7200系列,焦点频次为1300rate;2021年,推出了JM9系列,焦点频次到达1.5rate。

  按照公司2022年中期陈述显现,2022年5月公司成功研发了JM9系列的第二款图形处置芯片。该芯片可以或许满意地舆消息编制、媒介处置、package援助想象、嬉戏、虚构化等对高机能显现和野生智能计较需要的普遍利用。它可用于台式机、札记本电脑、一体机、服务器集群、工控机、自立末端等装备。这进一步证实了景嘉微公司在GPU范畴的手艺气力和产物立异才能。

  寒武纪是AI芯片范畴的独角兽公司,建设于2016年,2020年7月在科创板上市。公司专一于野生智能芯片产物的研发和手艺立异星空体育官网,产物普遍利用于消磨电子、数据中间、云计算的发展等多个范畴。行为AI芯片范畴的独角兽,寒武纪已获得了明显成绩:采取公司末端智能处置器IP的末端装备出货量跨越亿台;云霄智能芯片及加快卡已成功利用于国际支流服务器集群厂商的产物,并完结了大范围量产;颁发边沿智能芯片及加快卡。

  野生智能在种种利用处景中的成长,从云霄向边沿端扩大乃至下沉到末端装备,都离不开高效的智能芯片的撑持。为此,寒武纪面向云霄、边沿端和末端推出了三个系列差别品类的通用型智能芯片和处置器产物。此中,末端智能处置器IP合用于末端装备,云霄智能芯片及加快卡合用于云计算的发展场景,而边沿智能芯片及加快卡则专一于边沿计较利用。这类产物结构表示着寒武纪可以或许周全满意种种场景对智能芯片的需要。前往搜狐,察看更多