CN / EN
banner圖
掌握核心技術 駕馭光的運用

行業新聞

數據對於人工智能來說有多重要

日期:2019-07-01 來源:币游国际
        人工智能的目標是讓機器像人類一樣學會學習。算法訓練、深度學習等都需要大量數據支持,數據挖掘是人工智能做訓練樣本的前提條件。如無人車需要大量的試車數據不斷地測試算法,並在業務場景上形成自我改進的反饋係統。可見如果沒有數據的場景不可能實現人工智能,數據就是人工智能的引爆點。
數據對於人工智能來說有多重要_heydanbo.com
        基於深度學習的人工智能技術,核心在於通過計算找尋數據中的規律,運用該規律對具體任務進行預測和決斷。源數據需要進行采集、標注等處理後才能夠使用,標注的數據形成相應數據集。業務類型主要包括數據采集、數據處理、數據存儲以及數據交易等環節。 當前,人工智能數據集的參與主體主要有以下幾類:
        一是學術機構,為開展相關研究工作,自行采集、標注,並建設學術數據集。這類數據集主要用於算法的創新性驗證、學術競賽等,但其迭代速度較慢,難用於實際應用場景。
        二是政府,等中立機構,他們以公益形式開放的公共數據,主要包括政府、銀行機構等行業數據及經濟運行數據等,數據標注一般由使用數據的機構完成。
        三是人工智能企業,他們為開展業務而自行建設數據集,企業一般自行采集,標注形成自用數據集,或采購專業數據公司提供的數據外包服務。四是數據處理外包服務公司,這類公司業務包括出售現成數據訓練集的使用授權,或根據用戶的具體需求提供數據處理服務(用戶提供原始數據、企業對數據進行轉寫、標注),具體業務服務形式包括且不限於提供數據庫資源、提供數據采集服務,提供數據轉寫標注服務等。
        當前,人工智能基礎數據類型主要包括語音語言類(包括聲音、文字、語言學規則)、圖像識別類(包括自然物體、自然環境、人造物體、生物特征等)以及視頻識別類三個大類,從世界範圍來看,數據服務商總部主要分布在美國、歐洲等發達國家。但其數據處理人員則大多數分布在第三世界國家;我國語音、圖像類資源企業機構正處於快速發展階段,為產業發展增添了動力。


返回列表