DiVoMiner®設計理念及操作流程

DiVoMiner^®是一個基於雲端計算的文本大數據探勘及分析平台，以大數據技術輔助線上內容分析法為設計核心，利用電腦學習及人工校正編碼方式，一站式完成內容分析法的全部流程，包括建立資料庫、抽樣、編碼人員間信度測試、線上內容編碼、品質控制、統計分析和結果視覺化等流程。提供靈活而強大的團隊研究執行及管理功能，是兼具實用性和學術性要求的網路探勘和文本分析平台。

DiVoMiner^®平台的設計理念及方法論核心是大數據技術輔助線上內容分析法。大數據背景下，網路數據體量龐大且結構繁雜，分析難度較大，因此，研究之初，需要將大量資料搜集結構化，包括線上和本地資料，以此形成資料研究的基礎——資料庫。其次，利用電腦運算能力的優勢，使用網路探勘、電腦學習以及社群網路分析等手段，快速得出初步數據結果，可以據此瞭解資料概況和部分細節，尋找未知的規則。然而，在大部分的研究場景下，僅僅使用電腦分析可能未必能夠達到足夠的研究深度，因此，需要進一步在已知規則中深度探索研究意義及洞察，這時，可以使用線上內容分析，透過人工編碼、電腦編碼、電腦學習編碼，結合人的智慧，完成深度探勘。運用數據，得出價值。

DiVoMiner^®將研究方法中強調的系統化、客觀性和可量化的特點貫穿始終。落實到操作流程中，可區分為準備階段、探索、線上內容分析（編碼及品質監控）和結果呈現四大部分。

1. 準備階段：

確定不同類型的資料來源，分別建立資料子庫，例如，歷史文獻資料與社群媒體資料格式有所不同；不同的社群媒體資料類型有所不同；將格式不同的資料類型分門別類上傳至對應的資料子庫，完成建庫過程。

DiVoMiner^®針對資料庫的不同功能需求設計了四種類型資料庫。用戶上傳資料至編碼庫，不同格式的資料放至不同的子庫，不同子庫之間欄位可通用。後續資料探索、線上內容分析、統計分析及視覺化等均基於編碼庫中資料進行分析。清洗資料後刪除的資料放入回收庫。

測試庫設計用於測試編碼（前測編碼），要求編碼人員對相同的資料進行測試編碼，計算編碼人員之間信度，在信度達到可接受的一致性水平後，開始正式人工編碼。

如需要進行資料抽樣，可建立抽樣庫，以隨機或其他方式抽取部分資料，完成研究項目。

2. 探索：

完成資料建庫後，利用網路探勘或演算模型等電腦分析方法快速分析資料，查看資料結果。平台上可查詢整體資料的自動化訊息量趨勢和文字雲圖。

3. 線上內容分析：

編碼變數是內容分析法的基礎，在一定程度上，類目建構的品質決定了內容分析的成敗和好壞。由研究者設計編碼變數，由編碼人員閱讀文本材料併進行編碼或分類。編碼變數表又叫編碼簿，相當於問卷調查中的調查表。

對於內容編碼可使用電腦編碼或人工編碼，對於客觀性較強的類目，比如人名、機構名等，可以交由電腦判斷，電腦編碼的準確性高，速度快，效率極高。對於主觀性較強的類目，比如意向態度，電腦判斷的準確度可能較為欠缺，建議進行人工編碼。

對於品質監控，DiVoMiner^®提供即時資料監測功能，可隨時查看編碼人員工作績效以及編碼結果，提供便捷的方式修正資料結果。

4. 結果呈現：

完成內容分析後，可進入資料分析環節。在平台上，可快速查看單變數的次數結果（「編碼結果」頁面），亦支援用戶自製圖表（「統計分析」頁面），透過簡單的拖曳式操作，快速生成圖表，可調整視覺化效果，滿足用戶需求。

支援中心

DiVoMiner®設計理念及操作流程

Was this article helpful?