丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
業(yè)界 正文
發(fā)私信給陳嘉欣
發(fā)送

0

做AI硬件產品,技術說教那套早過時了|鯨犀百人談No.23

本文作者: 陳嘉欣   2024-11-29 18:45 專題:2021鯨犀產業(yè)數(shù)字峰會
導語:非常規(guī)營銷思路,才是AI硬件廠商出圈新范式。

作者丨陳嘉欣 覃倩雯

編輯 | 林覺民

AI浪潮席卷全球,無論是B端智能制造,還是C端各類軟件應用,AI逐漸滲透生產生活的方方面面,也推動人機交互模式朝更方便快捷的方向發(fā)展。

智能手機盛況在前,一批看到機會的軟硬件廠商紛紛下場押注AI硬件,希望自己能成為下一個“蘋果”。

2016年聲智剛創(chuàng)立時,恰好趕上智能音箱的浪潮,當時聲智主要給小米、華為等友商提供麥克風陣列模組、語音交互開發(fā)框架等技術支持。而在今年夏天,聲智依托自身聲學技術背景,在抖音上推出了首款AI耳機,并取得了不錯的成績。

Tob企業(yè)向Toc轉型并不容易,生成式AI帶來交互變革的同時也給廠商提出了新的難題。比如大模型應該如何給AI硬件賦能,什么樣的AI硬件更能被用戶接受,國內外市場何處能挖掘到最大增量。諸如此類的問題都在困擾著硬件廠商。

本期,我們邀請到了聲智科技副總裁、AI產品線負責人黃赟賀做客鯨犀出海百人談,分享她對AI硬件市場的洞察以及聲智的轉型經驗。以下是該場直播討論的內容,雷峰網(公眾號:雷峰網)鯨犀進行了不改變原意的編輯與整理:

鯨犀:請跟鯨犀出海百人談的朋友們做一下自我介紹

黃赟賀:大家好,我是黃赟賀,現(xiàn)任聲智科技副總裁,負責AI產品線。聲智聚焦關注AI大模型落地應用,在AI硬件產品領域做了很多年。今年我們推出了一款FairyClip珍珠耳夾式AI耳機,在抖音首月銷量達到10萬臺。今天希望借這個機會,能和對AI賽道感興趣的小伙伴們分享我們做產品以及創(chuàng)業(yè)的心路歷程。

鯨犀:說到AI耳機,那么AI耳機和傳統(tǒng)耳機有什么不一樣的地方?

黃赟賀:AI耳機和傳統(tǒng)耳機的區(qū)別,大家聽名字直觀感受就是多了AI,融合了人工智能技術。聲智在做AI大模型應用時候,當時一個思考就是如何讓我們的用戶愿意接受AI。2016年聲智創(chuàng)立時,正好趕上了智能音箱的浪潮。智能音箱的普及讓大眾對語音喚醒、語音指令等交互模式有了初步了解,所以我和家里上一輩人解釋我們的產品時,常會說,聲智的耳機相當于把智能音箱放在耳朵上了,他們也能很快理解AI耳機要怎么去用?,F(xiàn)在大部分廠商提到AI耳機,大多數(shù)的營銷方向還是在AI 翻譯、AI轉寫等工具屬性的AI能力上,以及其他包括AI眼鏡、AI戒指之類的,我們都管它叫手機配件,它無法脫離手機去獨立存在。我們期待這些AI硬件的下一步進化,是真正脫離手機,能夠獨立呈現(xiàn)的一個作品。類似騎行的場景,騎友們不必掏出手機,直接與AI耳機交互就能導航路線。

鯨犀:智能音箱可以做麥克風陣列,保證聲源定位和降噪等功能,耳機只能做一個麥克風,AI耳機怎么解決這些聲學問題呢?相比智能音箱,它還有哪些其他功能?

黃赟賀:音箱是遠場交互,噪音強人聲弱,但耳機是近場環(huán)境,在交互這塊會比音箱的表現(xiàn)更好。AI耳機又因為有大模型技術的加持,各方面反饋會比傳統(tǒng)耳機更好。因為它的延遲性會被降低,我們可以去做到流式的輸出,用戶先說出一個字的時候,AI就已經開始進行反饋,不會像過去一樣,系統(tǒng)響應需要很長一段時間。目前大模型的語音克隆技術也非常成熟,不會再讓用戶有機器音的疏離感??谡Z場景化也會更好,因為大模型翻譯出來的語義會更加連貫。另外,透露一個小秘密,聲智接下來準備出海的產品,我們會做到,您在這邊說中文,另一邊傳達到時已經變成純英語的狀態(tài),只要把翻譯轉化的時間拉到毫秒級別,基本兩個不同語種的人在溝通時候可以實現(xiàn)無感交互。對于AI智能寫作、AI翻譯、轉錄之類的功能,我們也在觀察后臺用戶數(shù)據(jù),基于實際用戶反饋,我們發(fā)現(xiàn)一些AI能力用戶理解門檻比較低,或者一些功能是用戶需求比較大的,我們后續(xù)系統(tǒng)升級也會加強這些能力。我們目前的產品思路,就是希望我們的耳機變成年輕人的AI搭子。我們一直認為,AI一定要在具體的場景里才能發(fā)揮作用,才能降低用戶理解門檻,而不能只把它作為一個工具擺在那里。

鯨犀:聲智這款AI耳機出圈的原因,還在于它的外形非常像珍珠,可以作為耳飾佩戴,可以給我們介紹一下嗎?

黃赟賀:聲智的設計思路來自前段時間美國大選哈里斯競選的時候,有人懷疑她戴的珍珠耳環(huán)其實是個藍牙耳機。這種珍珠配飾形態(tài)的耳夾式,大家容易會忽略它是一個耳機,在工作中依然可以佩戴,既能保證工作可以正常輸出,也更具顏值。近期我們還出了一個黑色款,跟黑神話悟空的色調很像,上架即售罄。我們營銷策略整體偏向年輕時尚,耳機的外觀設計方面,和傳統(tǒng)耳機做出差異化,也是我們覺得比較吸睛的點。聲智的直播間,也和其他友商的科技風格不太像,網友說我們老是展示功能展示佩戴效果,看起來像賣衣服的,的確我們直播間的小組長,原來就是做服裝直播的,這種非常規(guī)的營銷方式,可能也是聲智產品能做出圈的一個原因。

鯨犀:據(jù)我了解,聲智系統(tǒng)用的是自研大模型,聲智為什么要自研大模型?自研的大模型能在聲學技術上帶來什么不同之處?

黃赟賀:聲智的理念是“技術為產品服務”,我們是產品和運營在先,技術作為堅實的后盾。AzeroGPT的中文叫壹元大模型,取自于壹元初始、萬象更新,因為我們希望把0到1這個過程做到極致。做自研模型的關鍵在于它能根據(jù)產品需求以及用戶反饋及時做調整,避免采買帶來的滯后性。比如在最卷的語言模型訓練上,我們就關注到了一個精簡性的問題。因為人機交互場景不是長文概念,類似微信場景60秒一條語音,用戶不可能對著機器長篇大論,他希望得到的答案,也是基于提問給出的很精簡的、可用性很強的答案,自研大模型就可以根據(jù)我們觀察到的用戶需求,調整訓練方向。另外,大模型的運用也讓我們耳機的硬件成本降下來,并且在回聲抑制和噪聲消除等耳機功能方面,有更好更精準的效果。

鯨犀:AzeroGPT是能夠在語義上做理解,還是主要在語音上?

黃赟賀:我們現(xiàn)在模型構成是三個板塊,聲學、語音和語言。從交互邏輯來講,聲學先對聲音進行采集,采集聲音之后進行解析,降噪、回聲抑制都是對聲學信號進行處理,然后才到語音識別,音頻進行轉譯,再通過語音合成以聲音形態(tài)轉遞給用戶。當然我們的大模型參數(shù)肯定不會像大廠的大模型參數(shù)一樣那么大,所以我們在做這個模型的時候更關注它對人機交互流程上體驗效果的提升。所以我們更關注大模型嵌入到硬件里面的技術鏈路如何更順暢,讓響應速度達到極致,這也是聲智創(chuàng)立以來一直致力于解決的問題。

鯨犀:在聲學方面,這個大模型處理的結果是相當于一個怎樣的水平?比如說能對標豆包,還是不輸于GPT-4o?

黃赟賀:GPT4-4o我理解屬于端到端模型,我們是按照端到端語音模型去做訓練,因為它確實是在 AI硬件語音交互場景下最合適的技術底座。我們沒有想去對標哪家公司,更多的是技術要服務于產品。當然也會看市面上其他模型,發(fā)現(xiàn)其他模型或者AI產品的優(yōu)勢再取長補短,這也是為什么要自己做模型,可以根據(jù)產品迭代需求、用戶需求進行模型優(yōu)化,采集到合理反饋就會調優(yōu)。

鯨犀:目前很多用戶更習慣于手機端上下滑動,對話式的AI交互會不會造成一定用戶門檻?

黃赟賀:移動端的上下滑,我們叫圖形界面的交互,下一個形態(tài)就是語音交互,再到視覺交互,比如AI眼鏡。視覺更復雜,要求的算力也更高,像現(xiàn)在很多AI眼鏡看東西會暈,耳機就會好很多,這也是聲智會選擇AI耳機作為我們AI硬件的首發(fā)形態(tài)。

鯨犀:AzeroGPT會對外開放嗎?

黃赟賀:會對外。我們之前提到的大模型聲學、語音和語言三個板塊,目前官網都有一個API可以接入。聲智很多B端客戶像做全息數(shù)字人的,之前的數(shù)字人可能還是一問一答式,意圖理解、槽位匹配的時候,會要有一個運營團隊在后面做標注,必須是命中了這個問題的關鍵詞,數(shù)字人才能回答問題?,F(xiàn)在新一代的交互形態(tài)可以給很多產業(yè)賦能,我們也非常歡迎同樣做AI硬件的廠商,使用我們的大模型算法以及Azero交互框架。市場一定是百花齊放,大眾的認知才會變高,用戶的理解成本才會降低,我們的產品才能賣得更好。

鯨犀:聊完大模型,我們再聊聊品牌打造。到目前為止,AI耳機賣得最好的時候是什么樣的狀態(tài)?

黃赟賀:我們的AI耳機對外銷售是今年8月份,現(xiàn)在最好的成績是在抖音自營直播間,這一款耳夾式耳機單店單品一個月賣了10萬臺,ROI和整體的數(shù)據(jù)反饋都是非常好的,在抖音3C榜上連續(xù)半個月都是第一名,我們沒有任何投放動作,也能到前三。我們認為先在國內卷出來,才能在海外有一個很好的成績。而字節(jié)不僅國內有抖音,國外也有TikTok,能提供很順暢的平臺服務,讓聲智能夠及時動作。我們預計在今年11月份左右啟動海外直播間,直擊歐美、中東等市場。我們?yōu)槭裁磿x擇抖音這個賽道,就是要在最卷的里面卷出來,才能去海外卷。國內企業(yè)其實是非常卷的,卷AI、卷供應鏈、卷產品創(chuàng)意,卷用戶數(shù)據(jù)。要在國內先拼出來,才能在海外有一個很好的成績,我們的前輩像大疆、Insta360都是非常好的案例。

鯨犀:抖音3C賽道很卷,耳機更卷。從做品牌的角度來說,一個新品能拿到這樣的成績,您認為是做對了哪些事情呢?

黃赟賀:我一直蠻喜歡小米雷總的一句話,他說好多公司都是熬出來的。我覺得這個“熬”字非常貼切,因為我們做這個產品,整個團隊大概歷經了兩年的努力。現(xiàn)在的產品形態(tài),其實還有非常多種備選,今年下半年也會再出很多不同形態(tài)的產品。我們沒有為了搶占市場,快速推出一款產品直接面向市場。另外一方面,我們在做營銷的時候,不是直接以AI形態(tài)去教育用戶,而是采取了一種更“春風化雨”的方式,用潮玩圈的思路去做AI,是潮玩品有了AI能力,這樣大家就比較容易接受。比如聲智的耳機里有16種AI能力,整個設計風格也帶些游戲感,比如里面放吉祥物做串場,給到沉浸式體驗等。外觀設計方面也有很多小巧思,比如用軟硅膠材質達到輕巧目的,換音樂的按鍵也和平常的不太一樣。我們認為,用戶得先喜歡你的產品,才能用你的AI功能,團隊才能有數(shù)據(jù)去優(yōu)化產品功能,形成正反饋。

鯨犀:耳飾通常是女性更青睞,但玩3C的很多是男性,這種策略會不會造成用戶流失?

黃赟賀:這款單品設計的時候,沒有確定用戶消費性別,更多是考慮到實用、美觀度的提升。后出的黑色款,男性用戶也買的比較多,七夕節(jié)的雙色套餐,也有很多情侶用戶買。另外我們其他產品線,也有商務款之類的偏傳統(tǒng)耳機的樣式。

鯨犀:AI耳機售價定在199非常巧妙,定價策略是怎么設計的呢?

黃赟賀:我們的低定價是考慮到用戶對AI的嘗鮮門檻要低一點。因為聲智是從智能音箱價格戰(zhàn)里走出來的,最早智能音箱都是千元級,后面慢慢小米等廠商降到了199甚至更低,用戶嘗試成本不高,才快速打開市場。AI有很多功能,哪些功能是用戶真正需要的,我們也需要快速打開市場,去了解用戶需求,反饋升級系統(tǒng)。當然我們也有高價款去匹配不同細分人群的需求,比如今年會推出AI助聽器,相對來說高價一點,但對比國外AI助聽器動輒幾萬塊的水平,聲智更希望成為國產之光。聲智的聲學技術優(yōu)勢,在降低成本和擴展功能方面,都有很大幫助。

鯨犀:過去很多ToB公司在轉型做ToC的時候,思維邏輯轉換不過來,聲智轉型的一年多里,遇到過哪些問題?聲智怎么應對這些問題?

黃赟賀:我將這個過程定義為從技術到產品、產品到品牌的發(fā)展過程,而且這些過程都是聲智必經的。從2016年聲智開始做智能音箱,最開始聲智是算法支持,后面變成了做硬件跟算法的嵌套。我們也有國家專利獎的Azero的開發(fā)框架(AI算法與硬件結合的交互框架)。在做這個的時候,我們已經在做 AI 硬件了,只不過當時我們管它叫行業(yè)終端、智慧終端?,F(xiàn)在,我們就是把產品形態(tài)換了一個消費領域能接受的形態(tài)去呈現(xiàn),選擇了一個比較時尚的外觀,把 AI 耳機包裝成大家接受度更高的產品。內核的技術架構,對我們而言是成熟且穩(wěn)定的。我們目前最關心的還是研究用戶數(shù)據(jù)、市場反饋,做營銷做品牌,技術反而是最安心的部分。當然聲智轉型過程中也會有一些人員上的調整,但調整方向比較明確,營銷策略規(guī)劃都比較清晰,而且整個團隊都比較年輕,大家的網感、對最新消費市場的把握都會更強一點。我們將體驗店設在中關村創(chuàng)業(yè)大街的街上,也是方便用戶隨時過來進行產品體驗反饋,讓我們的工程師直面一線。

鯨犀:聊了這么多國內市場,聲智目前出海整體策略和規(guī)劃是怎樣的?現(xiàn)在的出海情況如何?

黃赟賀:聲智10月份剛剛參加迪拜舉辦的科技+創(chuàng)新展會,預計年底發(fā)布的新品SoundAI OWS Pro在GITEX現(xiàn)場順利完成了印地語、阿拉伯語、土耳其語等一帶一路國家小語種與中文的互譯。在商務場合中,用戶只要將充電倉遞給對方,就可以在符合商務禮儀的前提下,實現(xiàn)跨語言無縫交流。聲智目前也是響應國家一帶一路建設倡導,逐漸走出海外,中東在這條線上有很好的市場環(huán)境。然后今年聲智也會繼續(xù)在TikTok深耕,借助直播等渠道,進入北美和歐洲市場。我們也提前預測了一些海外市場可能會遇到的問題,比如說品牌認知不夠的情況下,怎么讓用戶去接受產品及定價,我們都做了完整規(guī)劃,期待第四季度海外會有良好表現(xiàn)。

鯨犀:怎么分析國外的3C市場?

黃赟賀:北大的路教授提出過一個觀點:出海等于海外創(chuàng)業(yè)。2023年的時候,大模型比較火,經常有很多論壇邀請我們去做一些圓桌討論。當時有一個主持人問我, ChatGPT做那么厲害,中國的大模型基本上都是望聞卻步的狀態(tài),我們有什么能力優(yōu)勢?有多少年的差距?我說中國有自己的優(yōu)勢,供應鏈優(yōu)勢是我們的優(yōu)勢,我們可以做很多產品創(chuàng)新,有很多不同的形態(tài)。早年間的智能音箱,美國所有的智能音箱加起來就是一小堆。中國的智能音箱有海量的形態(tài),這就是中國的優(yōu)勢。所以我們要把這個優(yōu)勢發(fā)揮到最大。我們的創(chuàng)新性、產品迭代的速度、成本優(yōu)勢、定價優(yōu)勢,這些都能在海外市場很好地獲客。且北美市場對于AI創(chuàng)新產品的接受度會相對高一些。

鯨犀:這個產品在海外會有市場嗎?未來的渠道策略是怎樣的?

黃赟賀:像AI指環(huán)、胸章、掛墜、耳機、眼鏡這些產品,我覺得整個市場都在探索AI形態(tài)。最開始鼠標,后面到PC,變成了觸屏,與智能音箱語音交互,到現(xiàn)在這個階段,一直在進行交互形態(tài)的升級。下一輪交互形態(tài)可能是脫離圖形界面交互。這個交互形態(tài)的載體是什么?大家都在探索,現(xiàn)在沒有結論說到底哪一個交互形態(tài)是完美形態(tài)。我比較欣喜,創(chuàng)業(yè)公司也好,大廠也好,大家都在尋求創(chuàng)新的狀態(tài),國內的“內卷”反倒會助長我們在海外的表現(xiàn)。當有一個友商出海很成功,會有更多的AI硬件產品出海獲得海外市場份額,那個時候全球會覺得 AI made in China 是一個很好的產品形態(tài)?,F(xiàn)階段,AI耳機對于聲智來講肯定是最好的一個AI硬件載體,“耳朵里的智能音箱”用戶理解成本門檻也會較低,我相信隨著市場的蓬勃發(fā)展,以及我們AI技術的不斷成熟和完善,包括市場策略的精細化,能更好地做出更符合市場需求的AI時代的新產品。(雷峰網)

雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。

分享:
相關文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說