在內容分析法(Content Analysis)中,內容編碼(Coding)是關鍵步驟,分類思維是核心要義。操作程式是把多模態資料(文本、圖片、音訊、視頻)轉化為量化資料,後續進行統計分析處理。在很多研究實踐中,也常採用量化、質化資料結合解讀的方式來達到研究目的。
傳統內容分析法中,內容編碼是人工針對文本進行逐一閱讀,填答編碼表,做完所有的內容編碼後,將編碼簿中的資料匯總整理,進行統計分析和視覺化效果呈現。這個過程非常耗時耗力(小編經常聽到用戶朋友們抱怨,做人工編碼做得頭暈眼花,簡直要哇的一聲哭出來)。
為了解決傳統內容分析法編碼操作繁瑣的問題,DiVoMiner平台的研發團隊想了不少辦法,最終確定採用結合了傳統內容分析法、大資料技術、人工智慧的創新執行方案,在內容編碼的方式上,提供了人工編碼(可電腦、AI輔助)、電腦編碼和AI編碼三種方式。
那麼,有小夥伴表示疑惑,同樣是做內容編碼,這三種方式到底有什麼差別呢?應該如何做選擇呢?想要弄明白這個問題,就得先瞭解這兩者的執行差異和各自的優劣勢。
先上結論,選擇何種編碼方式,關鍵看類目屬性和投入資源的水準!
客觀類目題目推薦電腦編碼,高效可靠,成本低;
主觀類目題目用(電腦輔助)人工編碼,準確性高,消耗人力,相對費時費力;
AI編碼則是兼顧客觀和主觀題目,效率高,速度快,需要投入一定的運算資源。
(見下表總結↓↓↓)

- 什麼情況下選擇電腦編碼?
客觀性的題目,如機構、人名、事件等,表達清晰,可以用語義概括,這種題目極為適合做電腦編碼,效率極高,非常省心省事,搭配系統電腦人的信度檢驗,編碼結果放入論文、發表高水準期刊無壓力!
- 什麼情況下選擇(電腦輔助)人工編碼?
如果是主觀性類目題目,以目前的科技手段難以做出準確判斷,如指定物件的意見判斷、模糊態度等無法利用電腦編碼快速完成,就推薦人工編碼,通過一定的電腦輔助手段,相對提升編碼效率 。
- 什麼情況下選擇AI編碼?
AI編碼適用於主觀、客觀類目題目,準確度可控,需要設置類目提示詞,對類目選項下定義,需要消耗運算資源。可以和人工編碼員的結果進行進度檢驗,編碼結果可用在發表論文中。
有時候在實踐中,一套編碼表中會同時含有客觀和主觀型類目,也可以採用混合編碼的方式完成資料處理。
實際上,(電腦輔助)人工編碼、電腦編碼,還有AI編碼,都是大資料技術輔助、人工智慧輔助內容分析法的一部分,適合不同的文本資料研究場景。接下來就詳細介紹一下(電腦輔助)人工編碼、電腦編碼和AI編碼的操作方式。
- (電腦輔助)人工編碼
顧名思義,由人工編碼員閱讀文本,並填答編碼表,以此方式完成內容編碼工作,適合分析主觀性類目。傳統內容分析法的操作方式正是如此,需要耗費大量的人力和時間成本,人工依賴性強,不適合大規模資料的分析任務。
作為長期圍繞內容分析法展開工作的DiVoMiner研發團隊深為理解人工編碼的“苦”,因此在“純”人工編碼的基礎上,開發出“電腦輔助”的功能,使用者可以對類目的選項設置配套關鍵字(詞)條件(關於「類目設置」,相關資訊可點這裡回顧),設置好的字詞可以在編碼文本中高亮顯示,並提供電腦預選,減少編碼員檢閱文本時查找、匹配資訊的功夫,即便是人工做編碼,相比傳統編碼方式,效率也有很大程度的提升,準確度也大為提高。

人工編碼的資料準確性依賴於編碼員的理解,因此為了保證資料的可靠性,需要在正式編碼前進行編碼員之間信度測試,關於信度測試的知識點,點這裡回顧。
- 電腦編碼
大資料研究場景下,動用的資料樣本動輒成千上萬,甚至十萬、百萬、千萬級別資料也不是稀罕事兒,人工編碼在這種資料量的重壓下捉襟見肘,難以為繼。因此,在資料分析方面迫切需要電腦的協助。
在內容編碼中,針對客觀性類目,可以用文字總結出題目選項的語義範疇,則推薦利用電腦執行文本的分類工作,一鍵執行,依據用戶自設的關鍵字(詞)邏輯條件,自動完成編碼表的填答,速度快,效率高,成千上萬條資料可以在短時間內完成,而且多次重複執行結果完全一致,容易驗證結果。
可以在對應資料庫的「自動編碼」或是「內容編碼」下的「自動編碼」中設置電腦編碼


需要注意的是,電腦編碼並不是完全交由電腦解決全部問題,電腦編碼結果高度依賴使用者自設的選項關鍵詞條件,“人”在其中發揮了極大的作用,人工介入的重要環節在於制定電腦分類的標準,因此用戶的研究能力、經驗等容易影響編碼結果的品質,並借此擺脫內容編碼等機械性質的繁雜工作,讓研究者的精力回歸研究中。
提示:不論是電腦編碼,還是人工編碼中的預選,依據都是由用戶自設的類目中選項關鍵字決定的,因此,編碼資料品質的高低,依然是取決於研究者的研究能力和思考成果,在一個研究裡,有可能需要研究者反復調整設定和矯正結果,才能達到一個較佳的編碼結果。
- AI編碼
AI編碼可快速對資料進行分類,相對人工編碼,AI計算效率極高,編碼結果也比較準確。AI編碼需要先設置AI類目,與電腦編碼的運行機制不同,AI類目需要對題目、選項設置提示詞,即是使用語言說明清楚編碼的分類依據,AI編碼的結果品質會與提示詞的品質嚴格相關。

設置妥當後,運行AI編碼的路徑方式與電腦編碼一致,均是在資料庫的「自動編碼」或「內容編碼」下的「自動編碼」進行資料範圍的設置和任務啟動。