DiVoMiner®是一個基於雲端計算的文本大數據探勘及分析平台,以大數據技術輔助線上內容分析法為設計核心,利用電腦學習及人工校正編碼方式,一站式完成內容分析法的全部流程,包括建立資料庫、抽樣、編碼人員間信度測試、線上內容編碼、品質控制、統計分析和結果視覺化等流程。提供靈活而強大的團隊研究執行及管理功能,是兼具實用性和學術性要求的網路探勘和文本分析平台。
DiVoMiner® 平台的設計理念及方法論核心是大數據技術輔助線上內容分析法。大數據背景下,網路數據體量龐大且結構繁雜,分析難度較大,因此,研究之初,需要將大量資料搜集結構化,包括線上和本地資料,以此形成資料研究的基礎——資料庫。其次,利用電腦運算能力的優勢,使用網路探勘、電腦學習以及社群網路分析等手段,快速得出初步數據結果,可以據此瞭解資料概況和部分細節,尋找未知的規則。然而,在大部分的研究場景下,僅僅使用電腦分析可能未必能夠達到足夠的研究深度,因此,需要進一步在已知規則中深度探索研究意義及洞察,這時,可以使用線上內容分析,透過人工編碼、電腦編碼、電腦學習編碼,結合人的智慧,完成深度探勘。運用數據,得出價值。
DiVoMiner®將研究方法中強調的系統化、客觀性和可量化的特點貫穿始終。落實到操作流程中,可區分為準備階段、探索、線上內容分析(編碼及品質監控)和結果呈現四大部分。
- 1. 準備階段:
確定不同類型的資料來源,分別建立資料子庫,例如,歷史文獻資料與社群媒體資料格式有所不同;不同的社群媒體資料類型有所不同;將格式不同的資料類型分門別類上傳至對應的資料子庫,完成建庫過程。
DiVoMiner®針對資料庫的不同功能需求設計了四種類型資料庫。用戶上傳資料至編碼庫,不同格式的資料放至不同的子庫,不同子庫之間欄位可通用。後續資料探索、線上內容分析、統計分析及視覺化等均基於編碼庫中資料進行分析。清洗資料後刪除的資料放入回收庫。
測試庫設計用於測試編碼(前測編碼),要求編碼人員對相同的資料進行測試編碼,計算編碼人員之間信度,在信度達到可接受的一致性水平後,開始正式人工編碼。
如需要進行資料抽樣,可建立抽樣庫,以隨機或其他方式抽取部分資料,完成研究項目。
- 2. 探索:
完成資料建庫後,利用網路探勘或演算模型等電腦分析方法快速分析資料,查看資料結果。平台上可查詢整體資料的自動化訊息量趨勢和文字雲圖。
- 3. 線上內容分析:
編碼變數是內容分析法的基礎,在一定程度上,類目建構的品質決定了內容分析的成敗和好壞。由研究者設計編碼變數,由編碼人員閱讀文本材料併進行編碼或分類。編碼變數表又叫編碼簿,相當於問卷調查中的調查表。
對於內容編碼可使用電腦編碼或人工編碼,對於客觀性較強的類目,比如人名、機構名等,可以交由電腦判斷,電腦編碼的準確性高,速度快,效率極高。對於主觀性較強的類目,比如意向態度,電腦判斷的準確度可能較為欠缺,建議進行人工編碼。
對於品質監控,DiVoMiner®提供即時資料監測功能,可隨時查看編碼人員工作績效以及編碼結果,提供便捷的方式修正資料結果。
- 4. 結果呈現:
完成內容分析後,可進入資料分析環節。在平台上,可快速查看單變數的次數結果(「編碼結果」頁面),亦支援用戶自製圖表(「統計分析」頁面),透過簡單的拖曳式操作,快速生成圖表,可調整視覺化效果,滿足用戶需求。