如果你在穀歌輸入穀歌,你可以打破互聯網。
(Jen理發師,這在英國喜劇“IT狂人”)
這裏提供的研究報告中探討的想法沒有使用經典測量技術測量公共議程。利用web服務的數據穀歌搜索觀察(gif),我們評估使用在線觀察測量尋求信息。在此,我們遵循的思想麥克勞德,貝克爾和伯恩斯(1974)經典一級議程設定必須通過考慮後續行為理論上和經驗豐富的觀眾反應源於先前的突出。利用提出的術語貝克爾,麥克白,麥克勞德(1975,39頁),我們區分“一級”和“後續”觀眾的反應。前者是指認知意識或突出等概念,後者通常是指行為的概念,如候選人在選舉中選擇或投票率。
接下來,我們專注於我們稱之為立即隨後觀眾反應。例如,人們可能會想知道更多關於一個問題(salience-driven媒體使用),甚至想要談論它(salience-driven談話)。我們既包含salience-driven行為下的信息尋求更一般的概念。我們假設觀眾立即反應這樣才出現一定程度的問題突出。此外,其他收件人特征像政治感興趣或需要取向(哈克,你們& Brosius, 2009)也可以培養觀眾立即響應。
理論由一級和隨後的觀眾反應之間的區別貝克爾et al。(1975)有一個很大的方法論意義。一級觀眾反應的認知,因此難以察覺的。相比之下,直接的觀眾反應表現在日常生活中,可以直接觀察到任何研究員。
方法論上來說,突出代表一個難以察覺的潛在變量,而直接的觀眾反應,比如salience-driven媒體使用代表可觀測變量清單。當立即觀眾反應出現問題突出,應該有這兩個概念之間的關係。因此,如果有一個強大的網絡信息搜索與問題之間的相關性顯著,前者為後者可以作為一個方便的代理。
在這個研究報告中,我們調查穀歌搜索查詢如何與傳統措施的公共議程。首先,我們簡要概括如何衡量公眾議程通過民意調查。其次,我們引入gif作為替代觀察工具來測量公共議程。第三,我們提出一個案例研究和比較gif與公共議程調查數據結果。第四,最後,我們將討論潛在的優點和缺點使用gif進行進一步的議程設置研究。
測量公共議程
使用調查測量認知維度
可靠和有效的測量帶來研究的突出問題是長期存在的問題。突出問題通常是通過測量特殊疑問句在民意調查(迪林高產&羅傑斯,1996,45-49頁)聚焦感知問題突出或人際關係問題等方麵突出“多方麵的概念”(Gadziala &貝克爾,1983,p . 122)稱為突出。然而,民意調查隻能提供間接措施的公共議程,因為帶來人員取決於報告國家麵臨的最重要的問題。即使最複雜的設計,結合封閉和開放式調查問卷的數據,研究人員必須依靠自我報告的調查對象。這也同樣適用於研究行為方麵的議程設置,如人際對話,測量使用調查結果(一個早期的例子,看到阿特伍德,孫,孫,1976年)。通常,如何問問題突出的問題(或者它的一個方麵)存到今日(cf。埃德爾斯坦,1993年;麥克勞德et al ., 1974;尼米&巴特爾,1985年)。因為我們隨後探索gif的效用作為替代觀察,非強製性工具來衡量公眾議程。
測量使用(在線)觀察行為的後果
問題意識和突出的行為後果,如即時信息尋求或後續對話基本上是可觀察到的過程。與新聞研究(科萬特2008)或媒體心理學(Ravaja 2004;Unz &施瓦布,2005),觀察是在大眾傳播研究中很少使用。這是最明顯的是由於觀察的難度超過少數選擇實驗室以外的人在同一時間。因此,議程設置研究采用參與觀察是相當有限的範圍(Kepplinger &馬丁,1986)。
可能解決小樣本問題的實地研究采用參與觀察在於自動化觀測工具,工作沒有觀察者。最常用的方法,這種收視率(韋伯斯特,Phalen & Lichty, 2000),這使研究人員能夠實時觀察許多接受者的媒體使用。然而,這些數據不太適合於議程設置研究,因為:(a)利息隻能測量粒度的項目不是問題;(b)用戶的可能性salience-driven信息尋求是有限的在線性媒體像電視;和(c)信息尋求可能不是唯一相關的項目選擇的動機。
我們認為,一個相對較新的和有前途的不引人注目的方式觀察已經因為互聯網的出現,為尋求觀察後續的溝通和信息。發生的任何通信通過HTTP (World Wide Web)之類的協議,SMTP(電子郵件),或NNTP (Usenet)可以記錄,存儲,與一些技術和分析,但人類的努力。例如,羅伯茨從,豐滿Dzwo (2002)檢查後續通信電子公告板(低潮)。作者分析了四個媒體的內容以及美國在線(AOL)的政治留言板。四分之三的選擇問題(移民、衛生保健、稅收和墮胎)顯著正互關聯之間的媒體內容和在線討論發現,導致作者得出這樣的結論:“[m] edia報道顯然可以為個人提供信息來使用互聯網的討論”(羅伯茨et al ., 2002,p . 464)。而用戶生成內容的分析,留言板、評論、聊天、或Twitter消息,有望成為一種強大的方法測量後續通信(夏瑪,肯尼迪,&丘吉爾,2009),我們在觀察信息尋求行為感興趣。幸運的是,互聯網為用戶提供了一個工具,這task-search引擎可以說是第一個,也可能是,設備信息尋找數以百萬計的人。根據comscore的最新估計,2008年美國在線用戶提交了1370億條搜索查詢,這意味著每天1.7查詢和用戶(南佛羅裏達商業雜誌,2009年)。
後Bloj (1975所引用的貝克爾et al ., 1975),我們認為總體搜索查詢後續行為的影響突出的公共議程提供有效和可靠的措施。每個個體搜索查詢至少需要意識到一個問題以及一定程度的承諾。對於一個政治問題這可能似乎源自其突出個人承諾。當然,人們也可以利用網絡搜索引擎還有其他原因,比如興趣或好奇心。但即使搜索查詢政治問題並不僅僅隻是源自卓越,我們假設隨著時間變化總數字表明公共議程的變化。
從測量的角度來看,搜索查詢有許多可取的屬性:調查問題相比,沒有官偏見或社會讚許性,測量是完全不引人注目的和發生。此外,對於許多用戶來說,幾乎沒有使用搜索引擎所涉及的工作,比買一本書或者一篇論文搜索百科全書。當然,互聯網用戶的人口仍然是不同於一般人,所以我們不能把完整的公共議程,以搜索查詢,以票麵價值。在德國,德國ARD / 2009 ZDF-Online研究表明,4350萬(67.1%)至少偶爾使用互聯網(Eimeren &釋放,2009)。比較德國的在線和離線的人口統計人口表明,那些沒有上網主要是女性,60歲,教育程度較低(格哈德&曼德,2009)。但除非尋求信息突出問題的潛在機製是根本不同的網民比offliners,在線搜索查詢的有效性測量公眾議程並不處於危險之中。
直到最近,缺乏可用的搜索查詢數據為研究目的。基本上,隻有像穀歌這樣的搜索引擎提供商,雅虎或微軟能夠收集和存儲這些數據的大量使用的公司自己為了優化服務為用戶和廣告合作夥伴。應用科學分析的查詢也因此相當罕見而突出,可能是因為它可以證明,搜索色情和非法下載占最常見的查詢(西爾弗斯坦,Marais Henzinger & Moricz, 1999)。
幸運的是,世界上最大的搜索引擎,穀歌最近開始向公眾提供總日誌文件的結果。搜索(Google web服務開始了他們的見解http://google.com/insights/search)2008年8月,作為後續他們早些時候穀歌趨勢的網站。gif提供公共訪問Google的搜索查詢記錄,並允許過濾的搜索詞,時間,地區。與老年服務,用戶不能僅僅看到這些數據的圖形表示形式,而且下載的實際數據表為一個特定的查詢搜索量。在本研究報告的其餘部分中,我們將研究這些數據的效用帶來research-case研究。
方法
為了檢查穀歌搜索查詢的有效性測量的公共議程,我們比較所提供的搜索查詢數據gif與總調查數據進行的電話采訪富彩研究所。根據以上提供的參數,搜索查詢可以被視為行為的後果問題突出。如果假設的關係是真的,我們希望看到一個強大的兩個時間序列之間的相關性。
作為一個案例研究中,我們使用一個單一問題的研究在2005年德國大選。具體來說,我們關注的是保羅•Kirchhof前聯邦憲法法院法官,海德堡大學的教授,德國總理安格拉•默克爾(Angela Merkel)的競選財政專家團隊。Kirchhof有爭議的想法在平坦的所得稅以及後來評論社會問題和性別角色產生了許多媒體的關注和爭論,導致他退出影子內閣選舉之後(Schmitt-Beck &法斯,2006)。
我們選擇這個案例研究的問題保羅Kirchhof主要出於實際的原因。首先,Kirchhof出現在公眾在競選中隻有一段有限的時間,在德國總理安格拉•默克爾(Angela Merkel)政府從他提名小組8月16日,直到9月18日在選舉日之後。這使我們能夠限製調查答案的編碼和數據檢索從穀歌到6周。第二,一個人的名字,而明確可以用於搜索查詢,方便調查數據的編碼人員找到提及這個問題。我們的方法應用到更複雜的問題肯定會需要更多的思考和努力。
搜索查詢數據
數據聚合搜索查詢從gif檢索網站使用以下設置(圖1)。選擇的數據僅限於德國所定義的特定範圍的IP數字搜索查詢的起源。請求的時間範圍是8月/ 2005年9月,我們前2周之後刪除。
兩個重要的限製是目前實現的gif。每日搜索量數據隻能從穀歌檢索長達8周,長時間隻有每周的數據提供的使用對於大多數帶來研究較少。這可以通過滑動兩個月的窗口期的利息,每年產生六個結果集。然而,第二個gif使得合並這些數據困難的限製:搜索量隻能作為歸一化數據,基於搜索查詢的相對頻率,峰值日期限內作為一個參考點。這是更少的問題對於我們的時間序列相關性,但估計絕對的措施目前無法獲得隻使用gif。
查詢字符串的規範為gif是非常簡單的。不支持複雜查詢連接與否,沒有模糊匹配或通配符(cf。荷蘭人& Vliegenthart, 2008)。對於許多應用研究情況下,手動規範不同的查詢檢索數據的變異和聚合是必要的。我們的案例研究中,一個簡單的搜索字符串很容易構建。為了占不同的拚寫這個名字我們使用以下搜索條件,加號標誌著布爾或:“kirchhof +基爾霍夫。”
使用這個查詢收益率,結果頁麵中描述圖1包括時間序列的圖形化顯示,匹配結果從穀歌的新聞檔案,和一個可下載的CSV文件。後者隻有登錄用戶,而其餘的是公共的接口。
調查數據
根據時間序列的分析是總數量的反應一個開放式問題是重要的問題。收集的數據是富彩使用標準化的計算機輔助電話訪談。調查覆蓋的人口德國18歲的合格選民,樣品是使用德國標準軟件抽樣程序(加布勒& Hader, 2002)。平均而言,共進行了500麵試每個工作日2005年期間的利息。不幸的是,這意味著沒有調查數據可用的周末。每日響應率從50%到60%不等(個人通信與富彩)。
問開放式的問題是:“你能回憶起任何重要問題最近在新聞媒體覆蓋你感興趣嗎?”和被麵試官作為自由文本輸入的反應。問題是多維的措辭,沒有明確捕獲的一個流程中描述的介紹。而不幸的是,這個問題的措施問題意識(“回憶”),突出(“重要問題”),在同一時間和興趣。我們不希望這是一個問題的相關分析,但告誡推斷絕對水平這個問題的問題突出。兩個學生分析所有響應,每回答指保羅Kirchhof編碼。未來的分析與同樣簡單的搜索詞,詞典自動編碼(cf當然是可行的。Krippendorff 2004)。
結果
在絕對數字,隻有一小部分的受訪者名叫保羅Kirchhof一個重要的話題。Kirchhof不出現在公眾議程,直到他的提名,然後迅速的峰值在3%左右的答案,然後再一個相當不穩定的關注度和一個小選舉前一周上升(圖2)。
時間序列對穀歌搜索查詢有關保羅Kirchhof看起來總有點類似的調查結果。有興趣急劇上升9月4日,這一天之間的第一次電視辯論默克爾和施羅德,Kirchhofs稅收大量討論的建議。另一個峰值搜索查詢發生一些10天後,Kirchhof建議後形成一個團隊傑出的基督教民主聯盟的財政專家弗裏德裏希·梅爾茲。
我們計算一個簡單的相關性兩個時間序列(r=報p< . 01)。首先,這溫和的相關性表明,搜索引擎查詢是一個有些不同但是相關的公共議程與傳統調查措施。然而,仍然有一些需要考慮的問題:例如,不像克勞斯和Fretwurst (2007)我們沒有指定ARIMA互關聯或轉移函數,因為數據點太少,太多失蹤調查數據由於周末。有跡象顯示的兩次係列中一個自回歸模式(即也就不足為奇了。,顯著的總體水平和信息尋求依賴於之前的值)。因此,我們預計,一部分常見的兩個時間序列之間的差異是由於固有的自回歸過程在每一個時間序列。盡管如此,我們認為兩個時間序列之間的相關性收集的不同意味著搜索引擎查詢是一種很有前途的指標代表一種新的方麵的公共議程。
討論
作為哈克et al . (2009,5頁)最近說,“議程設置的行為後果[…]仍很大程度上未被探索”。在本研究報告中,我們引入了一個新穎的方式測量公共議程通過聚合數據從查詢到穀歌搜索引擎。雖然給出的結果是基於一個非常簡單的案例研究中,我們相信,使用穀歌搜索觀察提供了一個有前途的工具研究議程設置過程。首先,數據收集使用gif是免費的,容易理解,很快,即使一些調優的搜索查詢是必需的。每日搜索量數據的可用性沒有缺失的數據進行時間序列分析更簡單。
然而,一些挑戰和開放的問題需要解決,方法和經驗:
我們還不知道有多少人轉向穀歌對於一個給定的問題,以及這如何與電話調查的受訪者人數有關。穀歌搜索查詢的絕對數量相關,例如,保羅Kirchhof(還)不公開。然而,這是少的問題議程的設置使用時間序列的相關性研究。
因為穀歌隻按原樣提供聚合數據,我們無法知道或測試如何查詢統計。目前尚不清楚,例如,一個詞的搜索量是增加了重複搜索相同的個體。
在一個相關問題上,gif數據的標準化使得國與國之間的比較,跨越困難的地區,和時間。進一步細化處理穀歌提供的數據是必要的。
由於受訪者和穀歌用戶從不同的人群,當然現在還不清楚觀察到的相關性可以很容易地推廣。畢竟,互聯網用戶至少比一般人群年輕化和知識化。這變得更加重要當實際議程設置過程相關的媒體內容在網上調查(cf與公眾議程。羅伯茨et al ., 2002)。然而,在10年內,代溝在互聯網的使用可能會比現在小得多。
總措施與傳統議程設置研究、生態謬誤的問題持續使用gif時數據(羅賓遜,1950)。換句話說,前麵提到的基於聚合數據的相關性。這種相關性可能不同於基於聚合數據基於個體層麵的相關數據(Erbring 1990)。注意需要注意的是gif和調查時間係列的變化並不能簡單的歸因於個人顯著的變化。
我們承認需要進一步的理論闡述和實證研究觀眾立即響應。具體地說,意識之間的關係,(即利息和突出和他們的行為後果。,media use and conversation seeking) needs further exploration on the individual rather than the aggregate level. As a reviewer of this research note rightfully pointed out, the relationship between salience and information seeking itself may be dynamic as well as issue- and person-specific. The general conditions under which GIFS data are (not) valid proxy variables for issue salience still needs further examination.
盡管如此,由於gif數據可用於幾乎所有的話題,對於許多國家乃至地區,回去好幾年,大量有趣的實證研究項目可能從這個數據源中獲利。這包括分析公共關係和廣告媒體共振,越野和加班時間比較政治和社會公共利益的問題,甚至預測明天的新聞從今天的收件人的信息。前瞻性,結合gif數據和媒體監控數據(例如,Google新聞)可能提供新的見解帶來動力。這種方法已成功地用於流行病學研究(Freifeld Mandl,裏斯,&布朗斯坦,2008,看到也http://www.google.org/flutrends)。
總之,互聯網時代顯然似乎需要進一步的理論闡述和實證檢驗這種新形式的公共議程動力學。我們期待後續研究使用在線數據和更複雜的問題,涵蓋更長的時間跨度,使用更複雜的技術和時間序列分析。