正在閱讀:

國(guó)海富蘭克林基金調(diào)研海天瑞聲

掃一掃下載界面新聞APP

國(guó)海富蘭克林基金調(diào)研海天瑞聲

根據(jù)披露的機(jī)構(gòu)調(diào)研信息2025年3月13日至2025年3月24日,國(guó)海富蘭克林基金對(duì)上市公司海天瑞聲進(jìn)行了調(diào)研。

圖片來(lái)源: 圖蟲(chóng)創(chuàng)意

根據(jù)披露的機(jī)構(gòu)調(diào)研信息2025年3月13日至2025年3月24日,國(guó)海富蘭克林基金對(duì)上市公司海天瑞聲進(jìn)行了調(diào)研。

基金市場(chǎng)數(shù)據(jù)顯示,國(guó)海富蘭克林基金成立于2004年11月15日。截至目前,其管理資產(chǎn)規(guī)模為844.32億元,管理基金數(shù)47個(gè),旗下基金經(jīng)理共16位。旗下最近一年表現(xiàn)最佳的基金產(chǎn)品為國(guó)富興?;貓?bào)混合(011152),近一年收益錄得33.53%。    

附調(diào)研內(nèi)容:

1、2024年收入增長(zhǎng)的驅(qū)動(dòng)因素是什么?

受益于大模型技術(shù)的快速發(fā)展以及應(yīng)用場(chǎng)景不斷落地,以智能終端廠(chǎng)商、科技互聯(lián)網(wǎng)公司等為代表的國(guó)內(nèi)外科技巨頭紛紛加大多模態(tài)數(shù)據(jù)投入以支撐其智能終端、內(nèi)容生成等領(lǐng)域的AI能力建設(shè)。在此背景下,以多語(yǔ)種、多音色為代表的智能語(yǔ)音業(yè)務(wù)需求、以及以指令微調(diào)、偏好對(duì)齊等為代表的自然語(yǔ)言業(yè)務(wù)需求同比均呈現(xiàn)大幅增長(zhǎng),整體上驅(qū)動(dòng)公司營(yíng)業(yè)收入同比顯著增加。

2、DeepSeek出來(lái)后,對(duì)數(shù)據(jù)需求的影響如何?是否會(huì)降低AI行業(yè)對(duì)數(shù)據(jù)的需求?

(1)Deepseek推出了一系列模型,其中V3模型依然使用了預(yù)訓(xùn)練、以及SFT等訓(xùn)練方式,其中預(yù)訓(xùn)練階段的token使用量達(dá)到了14.8T,遠(yuǎn)超GPT4等同類(lèi)可比大模型預(yù)訓(xùn)練階段的數(shù)據(jù)使用量,且在后訓(xùn)練階段也使用了一定規(guī)模的標(biāo)注數(shù)據(jù),這也更加說(shuō)明海量以及高質(zhì)量數(shù)據(jù)對(duì)于基礎(chǔ)模型能力提升的重要意義。

(2)關(guān)于讓大家震撼的R1模型,基于目前的公開(kāi)信息來(lái)看,其部分優(yōu)勢(shì)體現(xiàn)在推理類(lèi)任務(wù)上,尤其是那些具備較強(qiáng)的規(guī)則性、可以推導(dǎo)的任務(wù)類(lèi)型上,確實(shí)不需要大量的人工標(biāo)注,但是對(duì)于其他領(lǐng)域(尤其是更為廣闊的垂向領(lǐng)域)的復(fù)雜問(wèn)題,依然需要觀(guān)察,我們認(rèn)為高階的數(shù)據(jù)專(zhuān)家的參與依然非常重要。

(3)此外,數(shù)據(jù)質(zhì)量不僅影響模型獲取和表達(dá)知識(shí)的能力,還決定了模型生成內(nèi)容的風(fēng)格和準(zhǔn)確性,幫助DeepSeek實(shí)現(xiàn)了在輸出端的文采能力提升。

其一,高質(zhì)量數(shù)據(jù)可以提升模型表達(dá)和推理能力。優(yōu)質(zhì)數(shù)據(jù)包含準(zhǔn)確、連貫且富有表現(xiàn)力的語(yǔ)言樣本。例如,包含CoT數(shù)據(jù)可以引導(dǎo)模型在推理時(shí)進(jìn)行反思,進(jìn)而在生成回答時(shí)展現(xiàn)出清晰的邏輯和優(yōu)美的語(yǔ)言表達(dá)。這正是DeepSeek模型能夠生成既準(zhǔn)確又具有華麗文風(fēng)的關(guān)鍵因素之一。

其二,高質(zhì)量數(shù)據(jù)可以降低噪音和確保一致性。數(shù)據(jù)中的錯(cuò)誤、噪音或不一致信息會(huì)導(dǎo)致模型生成內(nèi)容出現(xiàn)語(yǔ)法或邏輯問(wèn)題。高質(zhì)量的數(shù)據(jù)則能有效減少這些問(wèn)題,使模型更好地學(xué)習(xí)到語(yǔ)言規(guī)律,從而提高整體生成質(zhì)量。

其三,高質(zhì)量數(shù)據(jù)可以提升泛化能力。數(shù)據(jù)的多樣性和全面性使得模型在面對(duì)不同領(lǐng)域和任務(wù)時(shí)都能生成高質(zhì)量的回答。豐富且準(zhǔn)確的樣本幫助模型在多種場(chǎng)景下自如切換風(fēng)格,無(wú)論是精煉的技術(shù)解答還是文采斐然的創(chuàng)意寫(xiě)作,都能游刃有余。

(4)往未來(lái)看,Deepseek模型的出現(xiàn),有望進(jìn)一步助推模型向產(chǎn)業(yè)端發(fā)展,真正讓大模型技術(shù)深入滲透到各個(gè)行業(yè)中,這一過(guò)程中必將凸顯專(zhuān)業(yè)知識(shí)的直要性,需要更多數(shù)據(jù)、以及數(shù)據(jù)專(zhuān)家的參與,因此我們看好并期待未來(lái)大模型在各行業(yè)百花齊放的局面。

3、未來(lái)AI數(shù)據(jù)如果自動(dòng)標(biāo)注了,會(huì)對(duì)公司及行業(yè)產(chǎn)生影響嗎?

首先,AI一定不會(huì)實(shí)現(xiàn)完全的自動(dòng)化標(biāo)注,因?yàn)闄C(jī)器如果想要持續(xù)演進(jìn),使其更接近于人類(lèi)的判斷和理解,就一定需要人類(lèi)作為引導(dǎo),通過(guò)人工標(biāo)注幫助其完成新知識(shí)的學(xué)習(xí),所以只要人工智能在持續(xù)發(fā)展和進(jìn)化就一定需要人類(lèi)參與,即無(wú)法達(dá)到完全的自動(dòng)化標(biāo)注。

另一方面,更加智能化的人機(jī)協(xié)作模式一直是數(shù)據(jù)服務(wù)行業(yè)的發(fā)展趨勢(shì),同時(shí)也是數(shù)據(jù)服務(wù)企業(yè)的核心競(jìng)爭(zhēng)能力之一,自動(dòng)化標(biāo)注的核心不是完全替代人類(lèi),而是提高人機(jī)協(xié)作效率,海天瑞聲近年來(lái)在研發(fā)領(lǐng)域持續(xù)加大投入,不斷提升公司數(shù)據(jù)生產(chǎn)的智能化水平,并據(jù)此形成規(guī)模效應(yīng)、實(shí)現(xiàn)降本增效。

4、公司的業(yè)務(wù)是否存在規(guī)模效應(yīng)?

公司業(yè)務(wù)是存在規(guī)模效應(yīng)的,一方面隨著公司在研發(fā)方面加大投入,自研平臺(tái)的能力逐步提升,可以賦能數(shù)據(jù)處理過(guò)程中的人機(jī)協(xié)作朝著更加智能化的方向前進(jìn),這就使得公司進(jìn)行更大規(guī)模的數(shù)據(jù)生產(chǎn)成為可能。同時(shí),數(shù)據(jù)產(chǎn)品的積累、平臺(tái)以及工具的研發(fā),在公司業(yè)務(wù)規(guī)模逐漸上升的情況下,相關(guān)的研發(fā)費(fèi)用、管理費(fèi)用將被攤薄;

從成本端看,數(shù)據(jù)生產(chǎn)的成本還有很大的下沉空間,對(duì)于成本控制我們會(huì)在兩方面進(jìn)行持續(xù)投入:一方面是繼續(xù)加大技術(shù)投入,采用更為合理的人機(jī)協(xié)同比例完成數(shù)據(jù)處理任務(wù),降低人員投入,提高處理效率;另一方面是加強(qiáng)供應(yīng)鏈資源管理能力,擴(kuò)大資源供給,降低單位成本。

此外,數(shù)據(jù)集產(chǎn)品一直是我們公司所堅(jiān)持的重點(diǎn)方向,公司開(kāi)發(fā)大量通用型、復(fù)賣(mài)率高的標(biāo)準(zhǔn)化產(chǎn)品數(shù)據(jù)集,反復(fù)給公司帶來(lái)利潤(rùn),也能實(shí)現(xiàn)訓(xùn)練數(shù)據(jù)產(chǎn)品的規(guī)?;?yīng)。

5、成本結(jié)構(gòu)里最大的部分是什么?如何能夠持續(xù)性的優(yōu)化成本結(jié)構(gòu)?

公司最大的成本就是原料數(shù)據(jù)采購(gòu)費(fèi)用,即:采集、標(biāo)注成本。一方面,公司通過(guò)繼續(xù)加大研發(fā)投入的力度,全面提升公司的算法能力、工程化能力,加深算法輔助能力與人工工作的結(jié)合,達(dá)到更佳的人機(jī)協(xié)同,這樣能夠做大規(guī)模、提升效率、降低成本;另一方面是加強(qiáng)供應(yīng)鏈資源管理能力,擴(kuò)大資源供給,降低單位成本。

6、公司提供的訓(xùn)練數(shù)據(jù)整體解決方案中,各個(gè)環(huán)節(jié)的技術(shù)難度如何?

首先,訓(xùn)練數(shù)據(jù)集的設(shè)計(jì)和原料數(shù)據(jù)采集環(huán)節(jié)是存在相當(dāng)?shù)募夹g(shù)難度的,比如語(yǔ)音類(lèi)采集,文本設(shè)計(jì)是否貼合實(shí)際場(chǎng)景、如何實(shí)現(xiàn)最小采集量且確保場(chǎng)景覆蓋豐富度等因素均是設(shè)計(jì)和采集環(huán)節(jié)需要考慮和解決的;在視覺(jué)類(lèi)采集方面,復(fù)雜的人像采集、物體影像采集,同樣具有如何設(shè)計(jì)合理的數(shù)據(jù)濃度達(dá)到最小成本最高訓(xùn)練效果,如果是垂直行業(yè)數(shù)據(jù)集的采集,例如交通行業(yè)內(nèi)的自動(dòng)駕駛領(lǐng)域,則存在準(zhǔn)入資質(zhì)、技術(shù)難度(包括但不限于對(duì)于交通場(chǎng)景、車(chē)輛傳感器等要素的綜合理解和實(shí)施能力)等方面的門(mén)檻。

數(shù)據(jù)標(biāo)注環(huán)節(jié)的難度在于面對(duì)大量的數(shù)據(jù)標(biāo)注需求,如何快速的找到充足的資源,而且通過(guò)算法平臺(tái)實(shí)現(xiàn)機(jī)器的輔助標(biāo)注,并在人機(jī)協(xié)作過(guò)程中,尋找效率與質(zhì)量的最佳平衡,在提升數(shù)據(jù)標(biāo)注效率、保證數(shù)據(jù)質(zhì)量的同時(shí)降低成本。

7、標(biāo)品化的產(chǎn)品數(shù)據(jù)集業(yè)務(wù)與定制化服務(wù)業(yè)務(wù)的區(qū)別是什么?

產(chǎn)品數(shù)據(jù)集是先于客戶(hù)需求形成的模擬數(shù)據(jù),是公司區(qū)別于其他競(jìng)爭(zhēng)對(duì)手的一大特色,基于公司對(duì)市場(chǎng)的判斷和通用化需求的提取能力,其屬于是一次性投入、未來(lái)重復(fù)授權(quán)銷(xiāo)售,對(duì)于公司的營(yíng)收、毛利有著重要作用;而定制業(yè)務(wù)的需求來(lái)源是客戶(hù)的定向化需求,有些定制業(yè)務(wù)的原始數(shù)據(jù)來(lái)源是客戶(hù)提供的實(shí)網(wǎng)數(shù)據(jù),公司提供純加工的服務(wù)。

客戶(hù)的AI產(chǎn)品在上線(xiàn)之前及初期,因?yàn)槠渥陨砩形串a(chǎn)生實(shí)網(wǎng)數(shù)據(jù),通常需要采購(gòu)模擬型數(shù)據(jù)集進(jìn)行算法模型的訓(xùn)練,在產(chǎn)品上線(xiàn)并運(yùn)行一段時(shí)間、產(chǎn)生大量實(shí)網(wǎng)數(shù)據(jù)之后,則會(huì)提供實(shí)網(wǎng)數(shù)據(jù)給到我們進(jìn)行數(shù)據(jù)加工,加工的數(shù)據(jù)反哺到客戶(hù)的產(chǎn)品上從而促進(jìn)其產(chǎn)品的迭代、升級(jí)。之后,客戶(hù)需要進(jìn)行產(chǎn)品功能或語(yǔ)種的拓展,再次需要購(gòu)買(mǎi)模擬數(shù)據(jù)集來(lái)支撐,后續(xù)再采購(gòu)數(shù)據(jù)加工服務(wù)進(jìn)行迭代。

8、訓(xùn)練數(shù)據(jù)產(chǎn)品和服務(wù)的定價(jià)模式、收費(fèi)模式是什么樣的?

定制服務(wù)定價(jià)模式:一般采用成本加成定價(jià)法。公司根據(jù)客戶(hù)的具體服務(wù)需求預(yù)估項(xiàng)目成本,在預(yù)估成本的基礎(chǔ)上,參考公司制定的指導(dǎo)毛利率水平,結(jié)合項(xiàng)目技術(shù)難度、復(fù)雜程度、時(shí)限要求等進(jìn)行報(bào)價(jià),并根據(jù)市場(chǎng)環(huán)境與客戶(hù)協(xié)商,最終確定價(jià)格。

產(chǎn)品定價(jià)模式:一般采用需求導(dǎo)向定價(jià)法。公司綜合考慮訓(xùn)練數(shù)據(jù)集的開(kāi)發(fā)支出、市場(chǎng)需求程度、預(yù)計(jì)未來(lái)重復(fù)銷(xiāo)售的頻率等因素,制定產(chǎn)品標(biāo)準(zhǔn)價(jià)格及價(jià)格區(qū)間,在銷(xiāo)售過(guò)程中,根據(jù)客戶(hù)的實(shí)際需求情況,以?xún)r(jià)格區(qū)間為基礎(chǔ)向客戶(hù)報(bào)價(jià),經(jīng)雙方協(xié)商確定最終銷(xiāo)售價(jià)格。訓(xùn)練數(shù)據(jù)產(chǎn)品通常以單個(gè)數(shù)據(jù)集為單位進(jìn)行定價(jià),定價(jià)比較靈活。

9、定制數(shù)據(jù)逐漸積累,是否可以轉(zhuǎn)化為自有的數(shù)據(jù)產(chǎn)品?

客戶(hù)定制服務(wù)涉及的訓(xùn)練數(shù)據(jù)在交付給客戶(hù)并完成驗(yàn)收后,所有權(quán)完全轉(zhuǎn)移給客戶(hù),海天瑞聲是不能用于自身產(chǎn)品建設(shè)的,這一點(diǎn)是公司始終遵循的知識(shí)產(chǎn)權(quán)要求。

在定制數(shù)據(jù)集的生產(chǎn)過(guò)程中,積累下來(lái)的經(jīng)驗(yàn)、know-how會(huì)幫助公司各方面能力的提升,例如工具平臺(tái)因?yàn)樘幚砹舜罅康亩ㄖ茢?shù)據(jù)集,使平臺(tái)完善性有很大的增益,加強(qiáng)了公司的數(shù)據(jù)處理能力;再如,在一些情況下,公司在生產(chǎn)定制數(shù)據(jù)集時(shí),也會(huì)根據(jù)對(duì)行業(yè)需求的判斷,在保障數(shù)據(jù)權(quán)屬劃分清晰的前提下,利用團(tuán)隊(duì)管理、資源獲取的便利性,同步安排額外的設(shè)計(jì)、采集和標(biāo)注工作,完成產(chǎn)品數(shù)據(jù)集的開(kāi)發(fā)。

10、行業(yè)里的玩家增多,會(huì)不會(huì)出現(xiàn)價(jià)格戰(zhàn)?

是否存在價(jià)格競(jìng)爭(zhēng)主要取決于該領(lǐng)域是否較為存在較高壁壘。在較為成熟的細(xì)分方向,比如中文智能語(yǔ)音數(shù)據(jù)領(lǐng)域,確實(shí)存在進(jìn)入者增多、價(jià)格競(jìng)爭(zhēng)的情況;但對(duì)于外語(yǔ)種領(lǐng)域,數(shù)據(jù)服務(wù)商則會(huì)有更高的議價(jià)空間。所以,未來(lái)公司將主攻有較高技術(shù)壁壘,存在較大毛利空間的細(xì)分場(chǎng)景,盡力避免價(jià)格競(jìng)爭(zhēng)帶來(lái)的過(guò)度消耗。

此外,公司也將通過(guò)持續(xù)的專(zhuān)項(xiàng)研發(fā)投入及研發(fā)升級(jí),進(jìn)一步提高自研平臺(tái)能力,通過(guò)智能化促進(jìn)產(chǎn)能提升、效率提升、成本降低實(shí)現(xiàn)規(guī)模效應(yīng)和盈利能力的提升。


未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。如需轉(zhuǎn)載請(qǐng)聯(lián)系:youlianyunpindao@163.com
以上內(nèi)容與數(shù)據(jù)僅供參考,與界面有連云頻道立場(chǎng)無(wú)關(guān),不構(gòu)成投資建議,使用前請(qǐng)核實(shí)。據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

海天瑞聲

140
  • 海天瑞聲(688787.SH):2024年年報(bào)凈利潤(rùn)為1133.61萬(wàn)元
  • 海天瑞聲(688787.SH):2025年一季報(bào)凈利潤(rùn)為37.16萬(wàn)元

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

國(guó)海富蘭克林基金調(diào)研海天瑞聲

根據(jù)披露的機(jī)構(gòu)調(diào)研信息2025年3月13日至2025年3月24日,國(guó)海富蘭克林基金對(duì)上市公司海天瑞聲進(jìn)行了調(diào)研。

圖片來(lái)源: 圖蟲(chóng)創(chuàng)意

根據(jù)披露的機(jī)構(gòu)調(diào)研信息2025年3月13日至2025年3月24日,國(guó)海富蘭克林基金對(duì)上市公司海天瑞聲進(jìn)行了調(diào)研。

基金市場(chǎng)數(shù)據(jù)顯示,國(guó)海富蘭克林基金成立于2004年11月15日。截至目前,其管理資產(chǎn)規(guī)模為844.32億元,管理基金數(shù)47個(gè),旗下基金經(jīng)理共16位。旗下最近一年表現(xiàn)最佳的基金產(chǎn)品為國(guó)富興?;貓?bào)混合(011152),近一年收益錄得33.53%。    

附調(diào)研內(nèi)容:

1、2024年收入增長(zhǎng)的驅(qū)動(dòng)因素是什么?

受益于大模型技術(shù)的快速發(fā)展以及應(yīng)用場(chǎng)景不斷落地,以智能終端廠(chǎng)商、科技互聯(lián)網(wǎng)公司等為代表的國(guó)內(nèi)外科技巨頭紛紛加大多模態(tài)數(shù)據(jù)投入以支撐其智能終端、內(nèi)容生成等領(lǐng)域的AI能力建設(shè)。在此背景下,以多語(yǔ)種、多音色為代表的智能語(yǔ)音業(yè)務(wù)需求、以及以指令微調(diào)、偏好對(duì)齊等為代表的自然語(yǔ)言業(yè)務(wù)需求同比均呈現(xiàn)大幅增長(zhǎng),整體上驅(qū)動(dòng)公司營(yíng)業(yè)收入同比顯著增加。

2、DeepSeek出來(lái)后,對(duì)數(shù)據(jù)需求的影響如何?是否會(huì)降低AI行業(yè)對(duì)數(shù)據(jù)的需求?

(1)Deepseek推出了一系列模型,其中V3模型依然使用了預(yù)訓(xùn)練、以及SFT等訓(xùn)練方式,其中預(yù)訓(xùn)練階段的token使用量達(dá)到了14.8T,遠(yuǎn)超GPT4等同類(lèi)可比大模型預(yù)訓(xùn)練階段的數(shù)據(jù)使用量,且在后訓(xùn)練階段也使用了一定規(guī)模的標(biāo)注數(shù)據(jù),這也更加說(shuō)明海量以及高質(zhì)量數(shù)據(jù)對(duì)于基礎(chǔ)模型能力提升的重要意義。

(2)關(guān)于讓大家震撼的R1模型,基于目前的公開(kāi)信息來(lái)看,其部分優(yōu)勢(shì)體現(xiàn)在推理類(lèi)任務(wù)上,尤其是那些具備較強(qiáng)的規(guī)則性、可以推導(dǎo)的任務(wù)類(lèi)型上,確實(shí)不需要大量的人工標(biāo)注,但是對(duì)于其他領(lǐng)域(尤其是更為廣闊的垂向領(lǐng)域)的復(fù)雜問(wèn)題,依然需要觀(guān)察,我們認(rèn)為高階的數(shù)據(jù)專(zhuān)家的參與依然非常重要。

(3)此外,數(shù)據(jù)質(zhì)量不僅影響模型獲取和表達(dá)知識(shí)的能力,還決定了模型生成內(nèi)容的風(fēng)格和準(zhǔn)確性,幫助DeepSeek實(shí)現(xiàn)了在輸出端的文采能力提升。

其一,高質(zhì)量數(shù)據(jù)可以提升模型表達(dá)和推理能力。優(yōu)質(zhì)數(shù)據(jù)包含準(zhǔn)確、連貫且富有表現(xiàn)力的語(yǔ)言樣本。例如,包含CoT數(shù)據(jù)可以引導(dǎo)模型在推理時(shí)進(jìn)行反思,進(jìn)而在生成回答時(shí)展現(xiàn)出清晰的邏輯和優(yōu)美的語(yǔ)言表達(dá)。這正是DeepSeek模型能夠生成既準(zhǔn)確又具有華麗文風(fēng)的關(guān)鍵因素之一。

其二,高質(zhì)量數(shù)據(jù)可以降低噪音和確保一致性。數(shù)據(jù)中的錯(cuò)誤、噪音或不一致信息會(huì)導(dǎo)致模型生成內(nèi)容出現(xiàn)語(yǔ)法或邏輯問(wèn)題。高質(zhì)量的數(shù)據(jù)則能有效減少這些問(wèn)題,使模型更好地學(xué)習(xí)到語(yǔ)言規(guī)律,從而提高整體生成質(zhì)量。

其三,高質(zhì)量數(shù)據(jù)可以提升泛化能力。數(shù)據(jù)的多樣性和全面性使得模型在面對(duì)不同領(lǐng)域和任務(wù)時(shí)都能生成高質(zhì)量的回答。豐富且準(zhǔn)確的樣本幫助模型在多種場(chǎng)景下自如切換風(fēng)格,無(wú)論是精煉的技術(shù)解答還是文采斐然的創(chuàng)意寫(xiě)作,都能游刃有余。

(4)往未來(lái)看,Deepseek模型的出現(xiàn),有望進(jìn)一步助推模型向產(chǎn)業(yè)端發(fā)展,真正讓大模型技術(shù)深入滲透到各個(gè)行業(yè)中,這一過(guò)程中必將凸顯專(zhuān)業(yè)知識(shí)的直要性,需要更多數(shù)據(jù)、以及數(shù)據(jù)專(zhuān)家的參與,因此我們看好并期待未來(lái)大模型在各行業(yè)百花齊放的局面。

3、未來(lái)AI數(shù)據(jù)如果自動(dòng)標(biāo)注了,會(huì)對(duì)公司及行業(yè)產(chǎn)生影響嗎?

首先,AI一定不會(huì)實(shí)現(xiàn)完全的自動(dòng)化標(biāo)注,因?yàn)闄C(jī)器如果想要持續(xù)演進(jìn),使其更接近于人類(lèi)的判斷和理解,就一定需要人類(lèi)作為引導(dǎo),通過(guò)人工標(biāo)注幫助其完成新知識(shí)的學(xué)習(xí),所以只要人工智能在持續(xù)發(fā)展和進(jìn)化就一定需要人類(lèi)參與,即無(wú)法達(dá)到完全的自動(dòng)化標(biāo)注。

另一方面,更加智能化的人機(jī)協(xié)作模式一直是數(shù)據(jù)服務(wù)行業(yè)的發(fā)展趨勢(shì),同時(shí)也是數(shù)據(jù)服務(wù)企業(yè)的核心競(jìng)爭(zhēng)能力之一,自動(dòng)化標(biāo)注的核心不是完全替代人類(lèi),而是提高人機(jī)協(xié)作效率,海天瑞聲近年來(lái)在研發(fā)領(lǐng)域持續(xù)加大投入,不斷提升公司數(shù)據(jù)生產(chǎn)的智能化水平,并據(jù)此形成規(guī)模效應(yīng)、實(shí)現(xiàn)降本增效。

4、公司的業(yè)務(wù)是否存在規(guī)模效應(yīng)?

公司業(yè)務(wù)是存在規(guī)模效應(yīng)的,一方面隨著公司在研發(fā)方面加大投入,自研平臺(tái)的能力逐步提升,可以賦能數(shù)據(jù)處理過(guò)程中的人機(jī)協(xié)作朝著更加智能化的方向前進(jìn),這就使得公司進(jìn)行更大規(guī)模的數(shù)據(jù)生產(chǎn)成為可能。同時(shí),數(shù)據(jù)產(chǎn)品的積累、平臺(tái)以及工具的研發(fā),在公司業(yè)務(wù)規(guī)模逐漸上升的情況下,相關(guān)的研發(fā)費(fèi)用、管理費(fèi)用將被攤薄;

從成本端看,數(shù)據(jù)生產(chǎn)的成本還有很大的下沉空間,對(duì)于成本控制我們會(huì)在兩方面進(jìn)行持續(xù)投入:一方面是繼續(xù)加大技術(shù)投入,采用更為合理的人機(jī)協(xié)同比例完成數(shù)據(jù)處理任務(wù),降低人員投入,提高處理效率;另一方面是加強(qiáng)供應(yīng)鏈資源管理能力,擴(kuò)大資源供給,降低單位成本。

此外,數(shù)據(jù)集產(chǎn)品一直是我們公司所堅(jiān)持的重點(diǎn)方向,公司開(kāi)發(fā)大量通用型、復(fù)賣(mài)率高的標(biāo)準(zhǔn)化產(chǎn)品數(shù)據(jù)集,反復(fù)給公司帶來(lái)利潤(rùn),也能實(shí)現(xiàn)訓(xùn)練數(shù)據(jù)產(chǎn)品的規(guī)模化效應(yīng)。

5、成本結(jié)構(gòu)里最大的部分是什么?如何能夠持續(xù)性的優(yōu)化成本結(jié)構(gòu)?

公司最大的成本就是原料數(shù)據(jù)采購(gòu)費(fèi)用,即:采集、標(biāo)注成本。一方面,公司通過(guò)繼續(xù)加大研發(fā)投入的力度,全面提升公司的算法能力、工程化能力,加深算法輔助能力與人工工作的結(jié)合,達(dá)到更佳的人機(jī)協(xié)同,這樣能夠做大規(guī)模、提升效率、降低成本;另一方面是加強(qiáng)供應(yīng)鏈資源管理能力,擴(kuò)大資源供給,降低單位成本。

6、公司提供的訓(xùn)練數(shù)據(jù)整體解決方案中,各個(gè)環(huán)節(jié)的技術(shù)難度如何?

首先,訓(xùn)練數(shù)據(jù)集的設(shè)計(jì)和原料數(shù)據(jù)采集環(huán)節(jié)是存在相當(dāng)?shù)募夹g(shù)難度的,比如語(yǔ)音類(lèi)采集,文本設(shè)計(jì)是否貼合實(shí)際場(chǎng)景、如何實(shí)現(xiàn)最小采集量且確保場(chǎng)景覆蓋豐富度等因素均是設(shè)計(jì)和采集環(huán)節(jié)需要考慮和解決的;在視覺(jué)類(lèi)采集方面,復(fù)雜的人像采集、物體影像采集,同樣具有如何設(shè)計(jì)合理的數(shù)據(jù)濃度達(dá)到最小成本最高訓(xùn)練效果,如果是垂直行業(yè)數(shù)據(jù)集的采集,例如交通行業(yè)內(nèi)的自動(dòng)駕駛領(lǐng)域,則存在準(zhǔn)入資質(zhì)、技術(shù)難度(包括但不限于對(duì)于交通場(chǎng)景、車(chē)輛傳感器等要素的綜合理解和實(shí)施能力)等方面的門(mén)檻。

數(shù)據(jù)標(biāo)注環(huán)節(jié)的難度在于面對(duì)大量的數(shù)據(jù)標(biāo)注需求,如何快速的找到充足的資源,而且通過(guò)算法平臺(tái)實(shí)現(xiàn)機(jī)器的輔助標(biāo)注,并在人機(jī)協(xié)作過(guò)程中,尋找效率與質(zhì)量的最佳平衡,在提升數(shù)據(jù)標(biāo)注效率、保證數(shù)據(jù)質(zhì)量的同時(shí)降低成本。

7、標(biāo)品化的產(chǎn)品數(shù)據(jù)集業(yè)務(wù)與定制化服務(wù)業(yè)務(wù)的區(qū)別是什么?

產(chǎn)品數(shù)據(jù)集是先于客戶(hù)需求形成的模擬數(shù)據(jù),是公司區(qū)別于其他競(jìng)爭(zhēng)對(duì)手的一大特色,基于公司對(duì)市場(chǎng)的判斷和通用化需求的提取能力,其屬于是一次性投入、未來(lái)重復(fù)授權(quán)銷(xiāo)售,對(duì)于公司的營(yíng)收、毛利有著重要作用;而定制業(yè)務(wù)的需求來(lái)源是客戶(hù)的定向化需求,有些定制業(yè)務(wù)的原始數(shù)據(jù)來(lái)源是客戶(hù)提供的實(shí)網(wǎng)數(shù)據(jù),公司提供純加工的服務(wù)。

客戶(hù)的AI產(chǎn)品在上線(xiàn)之前及初期,因?yàn)槠渥陨砩形串a(chǎn)生實(shí)網(wǎng)數(shù)據(jù),通常需要采購(gòu)模擬型數(shù)據(jù)集進(jìn)行算法模型的訓(xùn)練,在產(chǎn)品上線(xiàn)并運(yùn)行一段時(shí)間、產(chǎn)生大量實(shí)網(wǎng)數(shù)據(jù)之后,則會(huì)提供實(shí)網(wǎng)數(shù)據(jù)給到我們進(jìn)行數(shù)據(jù)加工,加工的數(shù)據(jù)反哺到客戶(hù)的產(chǎn)品上從而促進(jìn)其產(chǎn)品的迭代、升級(jí)。之后,客戶(hù)需要進(jìn)行產(chǎn)品功能或語(yǔ)種的拓展,再次需要購(gòu)買(mǎi)模擬數(shù)據(jù)集來(lái)支撐,后續(xù)再采購(gòu)數(shù)據(jù)加工服務(wù)進(jìn)行迭代。

8、訓(xùn)練數(shù)據(jù)產(chǎn)品和服務(wù)的定價(jià)模式、收費(fèi)模式是什么樣的?

定制服務(wù)定價(jià)模式:一般采用成本加成定價(jià)法。公司根據(jù)客戶(hù)的具體服務(wù)需求預(yù)估項(xiàng)目成本,在預(yù)估成本的基礎(chǔ)上,參考公司制定的指導(dǎo)毛利率水平,結(jié)合項(xiàng)目技術(shù)難度、復(fù)雜程度、時(shí)限要求等進(jìn)行報(bào)價(jià),并根據(jù)市場(chǎng)環(huán)境與客戶(hù)協(xié)商,最終確定價(jià)格。

產(chǎn)品定價(jià)模式:一般采用需求導(dǎo)向定價(jià)法。公司綜合考慮訓(xùn)練數(shù)據(jù)集的開(kāi)發(fā)支出、市場(chǎng)需求程度、預(yù)計(jì)未來(lái)重復(fù)銷(xiāo)售的頻率等因素,制定產(chǎn)品標(biāo)準(zhǔn)價(jià)格及價(jià)格區(qū)間,在銷(xiāo)售過(guò)程中,根據(jù)客戶(hù)的實(shí)際需求情況,以?xún)r(jià)格區(qū)間為基礎(chǔ)向客戶(hù)報(bào)價(jià),經(jīng)雙方協(xié)商確定最終銷(xiāo)售價(jià)格。訓(xùn)練數(shù)據(jù)產(chǎn)品通常以單個(gè)數(shù)據(jù)集為單位進(jìn)行定價(jià),定價(jià)比較靈活。

9、定制數(shù)據(jù)逐漸積累,是否可以轉(zhuǎn)化為自有的數(shù)據(jù)產(chǎn)品?

客戶(hù)定制服務(wù)涉及的訓(xùn)練數(shù)據(jù)在交付給客戶(hù)并完成驗(yàn)收后,所有權(quán)完全轉(zhuǎn)移給客戶(hù),海天瑞聲是不能用于自身產(chǎn)品建設(shè)的,這一點(diǎn)是公司始終遵循的知識(shí)產(chǎn)權(quán)要求。

在定制數(shù)據(jù)集的生產(chǎn)過(guò)程中,積累下來(lái)的經(jīng)驗(yàn)、know-how會(huì)幫助公司各方面能力的提升,例如工具平臺(tái)因?yàn)樘幚砹舜罅康亩ㄖ茢?shù)據(jù)集,使平臺(tái)完善性有很大的增益,加強(qiáng)了公司的數(shù)據(jù)處理能力;再如,在一些情況下,公司在生產(chǎn)定制數(shù)據(jù)集時(shí),也會(huì)根據(jù)對(duì)行業(yè)需求的判斷,在保障數(shù)據(jù)權(quán)屬劃分清晰的前提下,利用團(tuán)隊(duì)管理、資源獲取的便利性,同步安排額外的設(shè)計(jì)、采集和標(biāo)注工作,完成產(chǎn)品數(shù)據(jù)集的開(kāi)發(fā)。

10、行業(yè)里的玩家增多,會(huì)不會(huì)出現(xiàn)價(jià)格戰(zhàn)?

是否存在價(jià)格競(jìng)爭(zhēng)主要取決于該領(lǐng)域是否較為存在較高壁壘。在較為成熟的細(xì)分方向,比如中文智能語(yǔ)音數(shù)據(jù)領(lǐng)域,確實(shí)存在進(jìn)入者增多、價(jià)格競(jìng)爭(zhēng)的情況;但對(duì)于外語(yǔ)種領(lǐng)域,數(shù)據(jù)服務(wù)商則會(huì)有更高的議價(jià)空間。所以,未來(lái)公司將主攻有較高技術(shù)壁壘,存在較大毛利空間的細(xì)分場(chǎng)景,盡力避免價(jià)格競(jìng)爭(zhēng)帶來(lái)的過(guò)度消耗。

此外,公司也將通過(guò)持續(xù)的專(zhuān)項(xiàng)研發(fā)投入及研發(fā)升級(jí),進(jìn)一步提高自研平臺(tái)能力,通過(guò)智能化促進(jìn)產(chǎn)能提升、效率提升、成本降低實(shí)現(xiàn)規(guī)模效應(yīng)和盈利能力的提升。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。