2014年6月4日 星期三

為何要電子病歷 - 資料與資訊的差異

之前提到格式呈現是指人所看見之表象,資訊呈現是人所理解之內涵。這個真的得花費很多功夫去探討。(用語可以有很多,格式呈現也可以說是內容呈現,或者是資料呈現,這也許就是標準存在的價值)

根據電子文件定義,電子文件係指文字、聲音、圖件、影像、符號或其他資料,以電子或其他以人之之決無法直接辨識之方法,所製成足以表示其用意之記錄,而供電子處理之使用者。
首先要知道,電子文件的資料,人是無法直接辨識的。以一個黑白的點陣圖檔而言,說穿了在每一個座標位置上,也只是0與1的差異而已。就算是彩色圖片,也只是在每一個座標點上用更多的位元來代表GRB數字之組合。有了這些原始資料,在經由電子處理成人可辨識之格式呈現方式。

真的要細分其實還有實體儲存格式,這個就超出探討範圍。我們就簡單地說,什麼是Context,什麼又是Content。
Content比較容易懂,翻譯的話就是指內容。其實內容是很複雜的。

範是展
<Name>範是展</Name>
<H2>範是展</H2>
{Name:範是展}
PID||||範是展

以上都是內容,但是不帶呈現樣式(但部分已經帶有資訊呈現了)。

範是展

範是展
範是展

以上三個也是內容,但有包含呈現樣式。

但是,對人而言,核心的內容(也就是指資料)是「範是展」這三個字(字、詞再講下去又是語意問題)。而呈現樣式也會隱含語意,例如紅色字一般會認為是重要的意思。這個部分又得省略討論,免得岔提了。

Context就是針對此資料內容形成你我共同認知的資訊。一般翻譯成上下文,或者是脈絡。
其實,這個是有道理的,同一個資料內容,可能因為你所賦予的Context不同,就會發生資訊意義之不同。
也就是說,Content可以單一存在,但是基於你我共同的知識,或者約定成俗下,我們給他他Context,加以補充說明。這也就是有人稱之為MetqData, Schema等名詞。
若不是,我們就可以先有Context的認知來限定Content。資料內容就會被限定於此Context規範下。這下子又有新名詞出現叫做Domain。

到這邊,可能已經搞混了吧。來個實例說明吧。
80是什麼?白癡也可能會回答你,就是80呀。
120呢?這不是跟上面一樣嗎?
可是,當你有了某種特殊背景知識時,你可能會開始猜說,我要講的是血壓。
賓果!就是血壓。當我跟你說,我給你一組數據是血壓時,就算是寫成40/200,你也不會覺得很奇怪。(醫院收的都是病人,數據異常才叫正常)
而且呀,依據你的知識,你還可以跟我說,一個是收縮壓,一個是舒張壓。
可是,電腦知道嗎?
我寫成80/120或者40/200的話,電腦可能會除得一個數字給你。他怎麼知道前者是收縮,後者是舒張呢?
加上單位吧80/120 mmHg,這個就更符合大眾思維了。8/12 mmHg?不對,你會自動思考成8/12 cmHg。你又給電腦出難題了。有跟到嗎?電腦僅能處理人無法直接辨識的資料呀。所以,他能夠處理的就是最小單元內容。
留下兩張圖,讓大家思考了。誰是Context,誰是Content。另外,定標準又是定在什麼地方呢?




沒有留言:

張貼留言