使用資料常見問題

我該如何取得華人家庭動態資料庫的資料

華人家庭動態資料庫資料皆委託「學術調查資料庫」釋出,只要您符合學術調查資料庫的會員資格,註冊成為會員後,即可下載各期調查資料。詳細說明請參考本網頁「資料下載」頁面。

為何受訪者的資料並不連貫?有些樣本中斷了幾年又出現,或是只有一、兩年的資料?

由於受訪者可能因為搬家、忙碌、拒絕訪問等因素而無法完成訪問,因此部分樣本可能會出現中斷或只有幾年有資料的情形。

每個家庭只訪問一個人嗎?我要如何知道哪些樣本是同一家人?

原始抽樣是以一個家庭訪問一位受訪者的原則進行規劃,並進一步擴及其民國66年以後出生且年滿16歲的子女。所以每一家戶的抽樣主樣本只有1位(爸爸或媽媽),但會包含他的子女。抽樣主樣本與子女可利用受訪者編號進行合併。受訪者編號前6碼相同者即為一家人;個位數為0者即代表抽樣主樣本,其餘則為抽樣主樣本的子女。

為何不是所有抽樣主樣本的子女都接受訪問?

基於成本考量,我們只納入民國66年以後出生的子女。此外子女的聯絡資訊是由爸媽提供的,若爸媽不願意小孩受訪,或小孩本身不願意接受訪問,也可能沒有包含在資料庫中。

我可以將多年的資料合併使用嗎?應如何合併?

可以的。每位受訪者在資料庫中都有一個不會變動的「受訪者編號」,您可利用此編號,將同一位受訪者者各期的資料予以合併。

受訪者編號為何會有5碼到7碼長度不一的情形?

資料庫的受訪者編號一律為7碼數字。部分受訪者編號只有5位數或6位數的情形,主要是因為當初編碼時,這些受訪者的編號是以「00」或「0」開頭,在資料檔以數字格式呈現時,並不會顯示,因此看起來就只剩下5碼或6碼了。

為何部分年度資料沒有性別資訊?受訪者有工作,但卻沒有行職業等工作資訊?

為了節省訪問時間,不過度打擾受訪者,我們在工作、婚姻等題目,針對沒有變動的情形設計了跳答。例如工作相關題目,我們會詢問受訪者「您目前的主要工作跟上一次訪問時比較起來有變化嗎?」然後根據變化的情形設計跳過部分理應不會變的題目。這些資訊必須透過合併前期資料獲得;若受訪者很多年都沒有變動,可能必須合併很多年的資料才能找到答案。

為何同一位受訪者,但每年的出生年次、性別等基本資料卻不一致?

PSFD的問卷設計希望記錄受訪者「實際國曆出生年次」,但受訪者可能因晚報戶口造成身份證上的出生年次與實際不同;或者因國曆、農曆的關係造成差異。訪問時,若訪員沒有特別與受訪者確認,便可能會產生不同年度出生年次不同的現象。性別不同,則大多是當年筆誤造成的,並非訪問不同對象。近年,計畫小組已經著手釐清此問題,但還沒有更新至每期資料檔中。此問題建議可由「資料檢索及合併系統」中下載出生年及性別資料,或直接與計畫小組確認。

為何2003年問卷沒有詢問工作相關題目?我該如何獲得這一年的工作訊息?

2003年因為問卷設計的關係,改問生命歷程的問題,工作、婚姻相關資訊,改在2004年時補問,您可從RR2004資料中找到相關題目。

我該如何在參考文獻中引用資料?

在您由SRDA取得的釋出資料中,皆有一份「資料使用說明」文件,您可參考文件中的相關說明。由於個期刊或論文要求的參考文獻格式不同,請您是需求自行調整。
以下以RCI2018資料為例:
1. 中文參考文獻格式
于若蓉(2021)。家庭動態資料庫的建立:第十七年計畫(RCI2018)(C00333_2)【原始數據】。取自中央研究院人文社會科學研究中心調查研究專題中心學術調查研究資料庫doi:10.6141/TW-SRDA-C00333_2-1
2. 英文參考文獻格式
Ruoh-Rong Yu. (2021). Panel Study of Family Dynamics: RCI2018 (C00333_2) [Data file]. Available from Survey Research Data Archive, Center for Survey Research, Research Center for Humanities and Social Sciences, Academia Sinica. doi:10.6141/TW-SRDA-C00333_2-1

我該如何取得資料的DOI?

請您至SRDA學術調研研究資料庫,進入您欲取得DOI的資料頁面,即可找到該筆資料的DOI網址。此外,在每份釋出資料檔案中的資料說明文件中,也可以在資料引用說明資訊中,找到該筆資料的DOI資訊。

為什麼有些題目在問卷中的選項與資料檔中不同?

由於家庭動態調查2012年起採用電腦進行訪問。在問卷設計時,為配合訪問系統的功能,及訪問的順暢性,可能會有特殊的編排方式。但在資料釋出前,考量該題目與既有資料的一致性,會將資料重新編排。如果發現題目選項與資料檔不一致的情形,請參考過錄編碼簿的相關說明,或與計畫小組聯絡。

問卷代號RI、RCI、C…代表什麼意義?

家庭動態調查針對不同階段的受訪者,採用不同的問卷進行訪問,問卷大致分為主樣本首波問卷、主樣本追蹤問卷、子女問卷三種。

主樣本首波問卷的適用對象包含第一次受訪的主樣本,以及第一次以主樣本身份(年滿25歲)受訪的子女樣本。其中,前者的問卷代號為RI,後者則為RCI。問卷代號R代表受訪者(Respondents),I則為羅馬數字1,C則為子女(Child),因此,問卷代號RI代表受訪者首次訪問問卷,問卷代號RCI則代表子女受訪者第一次以主樣本身份接受訪問的問卷。

主樣本追蹤問卷的適用對象包含完成主樣本首波問卷的主樣本,以及完成主樣本首波問卷的子女樣本。問卷代號以R開頭,一樣為受訪者(Respondents)之意,在2000-2004年間,在R之後以羅馬字標示訪問波次,因此會有RII2000、RIII2001等等的代號。隨著不同樣本群的加入,訪問波次的標示日顯複雜,因此,2005年起,主樣本追蹤問卷統一以RR做為問卷代號,不再以羅馬字標示波次。

子女問卷的適用對象為年齡介於16至24歲間的子女樣本。問卷代號以C開頭(Child之意),緊接的羅馬數字代表子女問卷調查的執行序次。

為何我從SRDA下載的資料,樣本數比文獻中紀錄的少?

家庭動態調查為追蹤訪問調查。我們會持續訪問同一位受訪者。少數受訪對象,可能在訪問多個波次後,才發現其實際情況與抽樣設計不符,因此將回溯刪除資料,導致樣本數減少。
此回溯刪除樣本的原因,大多為出生年次超出抽樣設計範圍。由於調查對受訪者的出生年次是以「實際的陽曆」出生年次為準,而主樣本抽樣則視依據戶籍資料,若受訪者有晚報戶口的情形,就有可能導致實際出生年超出抽樣範圍的情形。子女樣本的部分,首次訪問是依據主樣本於問卷中回答的子女出生年進行樣本分派,實務上也有不少父母記錯子女實際陽曆出生年的情形。此外,也有部分特殊案例,個案判定為不合格樣本而刪除的情形。
若主樣本被判定為不合格樣本,其子女的問卷資料也將同步刪除。類似情形可能在訪問多個波次後才發現。對此情形,我們將回溯刪除資料,再重新釋出。