在當今數位科技發展迅速的背景下,數據的收集與利用變得越來越重要。捕獲數據和排放數據之間的聯繫,往往在於它們如何互相影響以及在日常生活中的應用。本篇文章將探討這兩類數據之間的相互作用,並引出一些關於數據重要性和未來的思考。
原始數據,或稱為初級數據,是從來源收集的數字、儀器讀數等數據。如果科學家設置了一個計算機化的溫度計,每分鐘記錄化學混合物的溫度,那麼每分鐘的溫度讀數就構成了原始數據。這些原始數據未經處理、未經清洗,無法確保完美無誤,也無法用於數據分析或統計。它們是數據處理的根基。
原始數據可能包含人為、機器或儀器的錯誤,且很難被驗證。不同的研究團隊可能會認為經過清理和處理的數據仍然是原始數據。
數據的生成主要有兩種方式:捕獲數據和排放數據。捕獲數據是透過有目的的調查或分析所得,而排放數據則通常是由機器或終端執行的輔助功能所收集。例如,現代的收銀機、智能手機和速度計等設備主要完成各自的功能時,卻也能夠作為二級任務收集數據。排放數據通常過於龐大而無法進行處理,最終成為過渡性數據被丟棄。
在計算機領域,原始數據特徵包括可能的錯誤、未經驗證的格式,以及不同的格式來自原始數據。舉例來說,某數據輸入表可能會以各種形式記錄日期,這些資料在經過捕獲後需進行標準化處理,才能更方便地被計算機和人類理解。
原始數據有可能成為可用信息,但需要經過提取、組織、分析和格式化的過程。
例如,超市的銷售終端日常收集大量原始數據關於顧客的購買行為。這些數據的價值並不在於其本身,而是在於經過分析後所獲得的見解。經過整理的數據能夠顯示出各類商品的銷售情況,幫助管理層做出更有效的決策,例如安排收銀員的工作時間。
數據分享的倡導者認為,只有當公民和社會組織能夠獲取到企業和政府所收集的數據,才能進行更深層次的分析。例如,一個政府可能聲稱其政策降低了失業率,但一個倡導貧困政策的組織若能獲得這些原始數據,透過分析可能得出不同的結論,對數據集的解讀有了更多的參考和意義。
Tim Berners-Lee強調,與其收集數據,不如讓數據分享變得透明,這樣才能促進科學的進步。
隨著科技演進,如何更有效地捕獲、處理與使用數據將成為整個社會面臨的挑戰。隨著原始數據的不斷增加,如何在海量信息中提取出有助於決策和改進的數據將會變得越來越重要。地球的未來與我們如何看待和處理數據息息相關,是時候思考數據帶來的機會與挑戰了嗎?