Instagram新推兩款AI過濾工具,沒錯!背后功臣就是Deep Text
該公司表示,這兩項工具可用來減少垃圾消息的數(shù)量,同時屏蔽內(nèi)容和視頻中的攻擊性評論。
自動評論過濾器自去年9月就一直存在,用戶可以選擇自動啟動該程序。該程序可利用機器學習來識別可能引人反感的評論。如果在評論過濾器開啟的情況下仍然出現(xiàn)攻擊性評論,那么用戶可以像以往一樣直接向Instagram報告。Instagram表示,評論過濾器目前僅支持英語,不過未來將支持其他語言。
另一方面,垃圾消息過濾器自去年10月上線以來就一直處于對外界保密的狀態(tài)。而上線9月有余都未被用戶發(fā)現(xiàn),于 Instagram 而言已經(jīng)說不準是好事還是壞事。目前該功能可以自動清除英語、西班牙語、葡萄牙語、阿拉伯語、法語、德語、俄語、日語和漢語共9種語言的垃圾消息。
雷鋒網(wǎng)了解到,F(xiàn)acebook于2012年以10億美元收購了Instagram,并將其內(nèi)部技術遷移至Facebook的數(shù)據(jù)中心。
據(jù)報道,此次Instagram 發(fā)布的評論過濾器就是使用了Facebook 旗下AML實驗室建立的“Deep Text”系統(tǒng)。在Facebook 上,其可以結合機器學習輔助器完成每日 40 億次以上的翻譯功能的處理。此外,該系統(tǒng)還能在一秒之內(nèi)理解超過二十多種語言的數(shù)千封郵件的內(nèi)容。
如此前雷鋒網(wǎng)報道的Facebook 在AI+廣告中的應用和探索一文里,就詳細的介紹了這一文本系統(tǒng)對 Feeds Ads的支持。
去年6月,Deep Text上線。其一開始被定位為內(nèi)部工具,用來幫助Facebook 工程師快速排序大量文本,創(chuàng)建分類規(guī)則。其后 Instagram 高管深入了解該系統(tǒng)之后,立即看到了機會——借其打擊垃圾郵件。因為對于Instagram 的用戶來說,垃圾郵件幾乎是一個極其影響用戶體驗的煩惱。
在決定使用該系統(tǒng)之后,Instagram 第一步就是聘請了一批人員對該平臺進行評論,并將評論按照“垃圾郵件”和“非垃圾郵件”分類。事實上,這種工作,在社交媒體涉及的技術行業(yè)而言非常普遍。先利用人類來訓練機器,讓其執(zhí)行單調甚至無聊的工作,如此反復,最終機器會慢慢變得聰明和智能。
Instagram 相關負責人表示,最終通過不斷地數(shù)據(jù)整合,有3/4的數(shù)據(jù)被送入 Deep Text。基于此,Instagram 的工程師可創(chuàng)建算法,并對垃圾郵件可進行正確的分類。
在經(jīng)歷4個多月的不斷測試和研究后,Instagram 團隊在去年10月悄悄地上線了垃圾郵件過濾的功能。Instagram 的CEO Kevin Systrom對該功能的效果感到十分滿意。他決定利用 Deep Text 來處理更復雜的問題——消除與Instagram 社區(qū)準則相悖的意見或評論。為此,Instagram 還公開發(fā)布了一個 1200字的長文,來解釋其社區(qū)的精神。
與垃圾郵件過濾功能的開發(fā)過程類似,這次Instagram 又聘請了一大批的人員,每天就重復干一件事——看評論,并確定該評論是否合適。然后將其分類是否涉及欺騙 or 種族主義 or 性騷擾等等。所有這些工作人員都必須會兩種語言。經(jīng)過一段集中的處理,這些人一共分析了大約200萬條評論。
同時,Instagram的員工率先在自己的手機上內(nèi)測了該系統(tǒng),以此協(xié)助公司調整算法。與垃圾郵件算法一樣,該系統(tǒng)會基于文本語義來分析發(fā)帖的人和評論者(以及其發(fā)表的歷史評論)之間的關系。通過一段時間對神經(jīng)網(wǎng)絡的訓練和使用真實數(shù)據(jù)對模型的測試,Deep Text 已經(jīng)可以探查到文本之間非常細微的語義差別。
直至今日,Instagram 終于正式宣布兩大工具的上線。
當然,就目前這兩大工具而言,仍然存在一些算法缺陷,如當被問及一些特定句子時,系統(tǒng)無法給出具體的回應。經(jīng)過前文對 Instagram 這兩個工具的開發(fā)過程的描述,我們也能看到 Instagram 的AI仍然依賴人類的力量,來訓練機器學習系統(tǒng)。
正如 Facebook歐洲、中東和非洲地區(qū)公共政策副總裁 Richard Allen 如是表述,F(xiàn)acebook“還需要很長一段時間,才能依靠機器學習和人工智能來處理評估仇視言論時的復雜性。”
相關推薦
DVBCN消息2010年7月7日電--Telairity卓越的H.264編碼技術是為全球近十億人觀看2010年世界杯足球賽提供支持的“秘密要素”。整個亞洲、南太平洋以及世界杯主辦國南非的觀眾都是依靠Telairity的H.264/AVC編碼器來收看高清(HD)和標清(SD)比賽轉播的。有了Telairity的H.264現(xiàn)代技術,世界各地的網(wǎng)絡運營商和廣播、衛(wèi)星及有線電視公司可以更換掉舊的MPEG-2壓縮系統(tǒng),為客戶提供更出色的視頻質量并顯著降低對帶寬的依賴,從而大幅減少傳輸成本。泰國國營電信公司CATTelecomPublicCompanyLimited安裝了Telairity高清和標清編碼器
意法半導體(STMicroelectronics,簡稱ST)宣布,其先進的高清電視系統(tǒng)級芯片(SoC)平臺取得了巨大進步,此項成果將意法半導體推向能夠運行基于Adobe®AIR®的游戲和其它應用軟件的下一代互聯(lián)網(wǎng)電視技術的最前沿。意法半導體已成功移植AdobeAIR®2.5forTV軟件至第三代先進互動高清機頂盒系統(tǒng)芯片平臺,并通過Adobe產(chǎn)品認證。AdobeAIR軟件是AdobeFlash平臺的一個重要組件,原始設備制造商(OEM)、原始設計制造商(ODM)、服務開發(fā)人員以及應用開發(fā)人員能夠在這個平臺開發(fā)豐富的網(wǎng)絡應用軟件和游戲,專門為機頂盒和數(shù)字電視等嵌入式設備和
TriplePlayIntegration銷售副總裁MikeNottage什么是三重播放集成?TPI公司是一家致力于提供數(shù)字家庭視頻平臺解決方案的專業(yè)軟件服務公司。TPI公司還是官方Adobe的“ScalingPartner”,為消費電子平臺提供FlashPlayer10、AIR和舞臺美術技術提供優(yōu)化的端口。我們有25名具有專業(yè)的項目管理和質量保障經(jīng)驗的高級工程師團隊,平均具有24年的工作經(jīng)驗.你們能夠提供什么樣的
DVBCN數(shù)字電視中文網(wǎng)訊(敖瑞),2012年6月15日(周五),由ARM主辦的“跨界、變革、多贏——ARM移動智能終端研討會暨應用開發(fā)者大會”在上海舉行。本次約有20名廠商代表上臺演講;參會并參與展示會的廠商超過30家,均為ARM在各個領域的合作伙伴。ARM亞太市場開發(fā)經(jīng)理AlanTsai做出了“移動終端GPU之趨勢與迷思”的精彩演講。Alan表示:在用戶體驗上來說,分辨率已經(jīng)可以高達人眼都無法辨析的地步了。公允的說,業(yè)界對GPU的評判標準存在太多的分歧:從三角形的角度來看,涉及到生成率、裁切率等指標,不同類型的GPU產(chǎn)品根本沒法比;從填充率的角度上