• 1.08 MB
  • 162页

《纵向的分析》翻译项目报告

  • 162页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'AThesisSubmittedinPartialFulfillmentoftheRequirementsFortheDegreeofMasterofTranslationandInterpretingATranslationProjectReportonLongitudinalStudyCandidate:YuYunqiMajor:MasterofTranslationandInterpretingSupervisor:WangShuhuaiHuazhongUniversityofScienceandTechnologyWuhan430074,P.R.ChinaMay,2013 独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩或扫描等复制手段保存和汇编本学位论文。保密□,在_____年解密后适用本授权书。本论文属于不保密□。(请在以上方框内打“√”)学位论文作者签名:指导教师签名:日期:年月日日期:年月日 华中科技大学硕士学位论文摘要本翻译项目报告是我在翻译《纵向研究》一书的基础上,对此次英译中翻译任务进行的描述、分析和总结。报告主要由翻译任务描述、翻译过程描述、翻译案例分析和总结四部分组成。该项目原文本为英文,书名为longitudinalResearch,系属SAGE大学论文集《社会科学中的定量法应用》系列丛书。本书从纵向研究目标、纵向数据收集设计、纵向研究问题和纵向分析方法等四部分对纵向研究做了详细介绍。该书行文简洁客观、举证频繁、专业数据较多。针对本次翻译项目的文体特征,我采取了直译为主、意译为辅的基本直译翻译方法。并且,在翻译完成后,我还从翻译等值理论出发,站在翻译审校的视角分析出我的原译文存在不同程度的翻译质量问题;同时,结合翻译公司两名翻译审校的修改意见,对其进行了尝试性修正。通过本次翻译实践,我认识到了专门化翻译的可行性。我认为,在翻译硕士专业内部分化不同指向性的专门化翻译方向,并开设相应的普及性课程可以大大优化翻译硕士学生某些方向的翻译水平,从而提高其在该类方向的竞争力。同时,我还认识到一名职业翻译应当具备丰富的专业知识、很强的时间观念和自省能力。关键词:英译中直译与意译翻译等值i 华中科技大学硕士学位论文AbstractThisreportisbasedonthetranslationpracticeofabooknamedLongitudinalStudy,aimingtodescribeandanalyzethetranslationprocess,aswellassumupexperienceandlessons.Itconsistsoffourpartsaltogether:taskdescription,translationprocessdescription,casestudyandconclusion.LongitudinalStudyisoneoftheSageUniversitypaperswhichconcernsquantitativeapplicationsinthesocialsciences.Itintroduceslongitudinalstudyfromfouraspects—thepurposeoflongitudinalresearch,designsforlongitudinaldatacollection,issuesinlongitudinalresearchandlongitudinalanalysis.Thewritingstyleofthisbookisconciseandobjective,accompaniedwithvariousexamplesandprofessionalterms.Sinceitisanacademictranslation,literaltranslationisusedasthemaintranslationmethod,togetherwithfreetranslationmethod.Afterfinishingthefirsttranslationversion,Iapplytranslationequivalencetheoriestoanalyzeitandfindoutseveralproblems.Inaddition,withtwocolleagues’help,Icomeupwiththemodifiedversion.Throughthetranslationpractice,IrealizethefeasibilityofspecializedtranslationorientationamongstudentsmajorinMasterofTranslationandInterpreting.Ibelievethattheinternalclassificationsoftranslationorientationcangreatlyoptimizestudents’translationlevelinspecializedorientationandthusenhancingtheircompetitiveness.Inthemeanwhile,Ialsorecognizethataprofessionaltranslatorshouldhaveawealthofknowledgeconcerningdifferentmajor,astrongsenseoftimeandself-examination.KeyWords:E-CTranslationLiteralTranslation&FreeTranslationTranslationEquivalenceii 华中科技大学硕士学位论文目录摘要...................................................................................................................................iAbstract...............................................................................................................................ii1引言................................................................................................................................12翻译任务描述................................................................................................................22.1翻译文本介绍..............................................................................................................22.2委托方要求..................................................................................................................23翻译过程描述................................................................................................................33.1译前准备......................................................................................................................33.2翻译过程......................................................................................................................33.3译后事项......................................................................................................................44翻译案例分析................................................................................................................54.1理论思考......................................................................................................................54.2用直译为主、意译为辅的策略指导翻译实践..........................................................74.3用翻译等值理论评价译文质量.................................................................................115总结..............................................................................................................................205.1翻译实践中未解决的问题及相关思考....................................................................205.2对今后学习工作的启发及展望................................................................................20参考文献............................................................................................................................22致谢................................................................................................................................23附录1:术语表...............................................................................................................24附录2:翻译项目原文...................................................................................................25附录3:翻译项目译文.................................................................................................103iii 华中科技大学硕士学位论文1引言作为华科大招收的第一届翻译硕士笔译学生,在为期两年的全日制学习中,我不仅通过“翻译研究方法论”、“计算机辅助翻译”这类课程为笔译实践奠定了理论基础和辅助工具基础,还通过“文学翻译”、“商务翻译”、“法律翻译”、“医学翻译”等实践性课程以及“笔译工作坊”对各种类型文本的翻译有了总括性的了解。与此同时,我从研一下学期开始就在翻译公司实习,对前文提及的各类文本翻译都有所接触。理论联系实际项目操作,感触颇深。本文将以我在翻译公司实习期间接手翻译的《纵向研究》一书为研究对象,分解专业领域英译中项目的具体操作过程,并运用所学理论知识结合翻译实践中遇到的问题探讨相应的翻译对策。1 华中科技大学硕士学位论文2翻译任务描述2.1翻译文本介绍本文以我在翻译公司实习期间接手翻译的《纵向研究》一书为研究对象。该项目原文本为英文,书名为longitudinalResearch,作者ScottMenard,系属SAGE大学论文集《社会科学中的定量法应用》系列丛书,属于文学大类里的社会科学分支。longitudinalResearch一书第一章是一个绪言部分,概述了纵向研究方法自1665年以来的发展历史,并提出了应根据研究中使用的数据和分析方法来定义纵向研究的定义方法。第二章讲述了纵向研究的两大目标是描述变化规律,并建立因果关系的趋势方向(正的还是负的,从Y到X还是从X到Y)和量级(量级为零则表示两者不存在因果关系)),并对纵向数据的偶然性和必然性进行了详细分析。第三章介绍并讨论了收集纵向数据的六项基本设计方案,包括非典型纵向设计、总人口设计、重复横向设计、循环追踪设计、纵向追踪设计以及其它设计变体。第四章讲述了可能会对纵向数据的质量造成影响的问题,包括追踪损耗和受访者回忆偏差,并对其进行了详细的分析。第五章概述了纵向分析的方法,介绍了纵向分析的定义、变化的测量和变化模式的描述,因果分析的定义以及时间和因果次序的分析方法,并重点对纵向数据和横向数据进行了对比与分析。总体来说,longitudinalResearch一书整体脉络清晰,表达意思明了,举证频繁,专业术语较多。2.2委托方要求完成形式:独立完成,然后交由公司两名审校人员先后进行修改点评。期限:全部译文自接稿之日起,18天内完成。质量:委托方称翻译后可能会出版,因此质量上应符合出版要求。2 华中科技大学硕士学位论文3翻译过程描述3.1译前准备首先,为了确保专业术语及相关实验过程翻译的准确度,我在图书馆借阅了一些社会科学,尤其是纵向研究方面的书籍,以了解相关的背景知识。其次,由于翻译项目原文有三万字左右的篇幅并且属于严谨度较高的科学文本,为了保证译文前后术语的一致性和行文的严谨性,我决定在正式翻译之前,先通看全文,根据使用频率挑出有代表性的词汇,制定一个术语表。翻译策略方面,我计划在保证忠实原文、译文通顺的基础上,直译为主,意译为辅,两者结合应用。翻译计划方面,客户要求平均每天需要翻译4页-5页,5天提交一次译文,全部译文自接稿之日起,18天内完成。翻译质量控制方面,我采用的是自我校对与他人校对相结合的方案。突发事件应急预案方面,为了保证翻译项目能够保质保量地如期完成,同时也为了避免因为未曾预料的突发事件的发生导致延期交稿,我初步确定的方案是在保证翻译质量的前提下,自我分配8页/天的任务量。3.2翻译过程首先,在确定术语表后,我按照自我分配的8页/天的任务量进行了初译。同时,在翻译过程中对术语表准确度也进行了不断的修正。其次,每次翻译之前,我都会通读前面的译文,进行初期的自审。检查译文语句是否通顺,逻辑是否合理,表达是否适当,术语是否统一。此外,由于翻译项目期内我都有课业任务在身,确实出现了一些可能会影响翻译进程的突发事件。好在自我分配的任务量是翻译公司给定任务量的两倍,所以总体进度还是先于预先要求的,最后也在规定日期之前交稿了。3 华中科技大学硕士学位论文3.3译后事项首先,在完成全文翻译后,我抛开原文,站在中文读者的角度进行了再次的自审,检查语句、表达、内在逻辑及术语一致性的问题。其次,我的译文还交由两名公司的审校人员先后进行了修改和点评,用不同颜色的标记进行了标注。淡紫色和淡黄色是两名审校人员对一些细微的表达问题上在原文进行的修改,方便译者比较分析。同时,用醒目红色标出的是表达不清、逻辑混乱等严重不妥之处,方便我清楚看到译文的不足之处并进行修改。4 华中科技大学硕士学位论文4翻译案例分析4.1理论思考4.1.1直译与意译及其适用文体直译与意译是译者在翻译过程中采取的两种翻译策略。直译也叫“逐字翻译”,它要求按照源文本的语句组织形式与顺序来转换译文本,而意译则更强调译文本对源文本意思的有效传达。直译法是将忠实于原文的内容放在首位,其次是原文的形式,最后才是保证通顺的译文形式。意译法是将忠实于原文的内容放在首位,其次是通顺的译文形式,不拘泥于原文形式。无论是直译法还是意译法,都需要满足“忠实、通顺”的要求。值得一提的是,直译与意译两种翻译策略并不是孤立存在的,在很多情况下,译者需要结合具体情况,对两者进行灵活的运用。翻译策略的选择与源文本的文体有很大关联。刘宓庆在其作品《文体与翻译》(1998)一书中对直译与意译的适用文体作了详细介绍。翻译的层次:直译或意译常见的文体严格的直译条约、法典(Literalnes、规章、政s)府公文;政要求较严格的治论文及文直译献一般学术理论、科技情基本直译报与著述一般要求直新闻报道和译,但必须考分析;报刊虑可读性特写直译与意译兼传记、游记顾,充分考虑、札记等;可读性文艺小说基本意译,力舞台或电影求获得最佳可剧本;抒情读性散文译文的可读性必须完全意译(Readability方能达意,力)求获得最佳可读性与艺术性诗歌;歌词图4.1.1直译与意译的适用文体分类5 华中科技大学硕士学位论文从图4.1.1可以看出,根据所属的文体不同,译者应选择的翻译层次也不一样。对于条约、法典这样的对格式和措辞的要求都非常严格的文体就需要采用较严格的直译方法。随着文体正式性的减弱,翻译的层次也从较严格的直译转向直译与意译兼顾再到基本意译。最后,对于诗歌和歌词的翻译,为了获取最佳的可读性效果,则必须采取完全意译的翻译方法。4.1.2翻译等值理论翻译等值(TranslationEquivalence)作为国外翻译理论核心概念之一,在评价翻译质量方面具有举足轻重的作用。雅克布森在1959年最早在其论文《论翻译的语言学问题》(OnLinguisticAspectsofTranslation)对等值(equivalence)一词展开讨论。他认为,译者负责记录和传输来自另一语言的信息,因此,翻译过程包含着两种不同语言信息的对等。而要实现从源语到目的语的信息对等,两种不同语言的语言单元也要相应的发生变化。继而从语言学和符号学的角度,雅克布森提出了关于等值问题的一个著名论断:差异性等值是研究语言问题的核心,也是语言学最为关心的问题。意义对等的问题集中到了不同语言的结构和用辞上的区别,而不再是意义的“不可译”。他强调,对于某个词的隐含意义,即使人们从未真实经历,也还是可以理解的。只有诗歌是个例外,因为诗歌是一种形式可以表达意义的文学形式,某些“语音相似性可以传达语义关系”是“不可译”的,必须转换表达方式。在20世纪60年代,关于意义对等的问题引起了国外翻译界的广泛讨论。卡特福德在1965年出版的《翻译的语言学理论》(ALinguisticTheoryofTranslation)一书中提出了“翻译转换理论”(Translationshift),为翻译理论研究开辟了新的途径。他以系统语言学为基础,认为翻译活动的中心问题就是在源语和目的语之间寻找等值成分。这种等值关系可以在“层次”(levels,语音、字系、语法、词汇等)和“级阶”(ranks,句子、子句、词组、词、词素等)的任何一个交叉点上建立。他进而对形式对应(formalcorrespondence)和文本等值(textualequivalence)作了一个较为明显的区分。形式对应是指译文的任何句子范畴(词类,句子成分等)都能够与原文尽可能地实现一一对应。而文本等值是指在特定语境中,某一译语文本或其部分成6 华中科技大学硕士学位论文为一段给定源语文本或其部分的等值成分。另一较有影响的翻译理论是奈达(1964)提出的“翻译科学说(scienceoftranslating)”。他认为,翻译形式有两种:形式对等和内容对等。形式对等是指源语的形式特征必须完全复制到目的语当中去。奈达把翻译等值归类为“翻译四大要素(fourbasicrequirementsofatranslation)”之一,即:言之有理;有效传达原文意思;表达通畅;与原文有相同的读者反应。随后奈达补充完善了自己的翻译理论,提出了“动态对等理论(dynamicequivalence)”,主张在目的语中用最贴近源语的自然对等语再现源语信息,首先是意义对等,其次是文体对等,认为译文接受者对译文的反应与原文接受者对原文的反应应该基本相同。鉴于内容和形式在很多情况下难以实现同时完全对等,奈达主张“意义为主,形式为次”的观念,以达到动态对等的最佳效果。后来在与deWaar合著的《从一种语言到另一种语言:论圣经翻译中的功能对等》(1986)一书中,提出了“功能对等”(functionalequivalence)这一概念,它突出了翻译的交际功能,认为翻译必须以读者为服务对象,强调读者的反应。因此,在评判一篇翻译是否成功时,首先要看它是否能被接受者即时看懂,是否能引起思想、信息、感情的交流作用。4.2用直译为主、意译为辅的策略指导翻译实践针对本次翻译项目的具体情况,longitudinalResearch一书属于图4.1.1归类的一般的学术理论著述,所以在翻译过程中,我采用的是直译为主、意译为辅翻译策略,将准确传递原文内容放在首位,尽量保证与原文形式一致。1)原文:Ourreasonsforusingabroaderdefinitionoflongitudinalresearchare,first,thelackofconsensusregardingwhatconstituteslongitudinalresearch,andsecond,theusefulnessofconsideringthedifferentfeaturesofthefullrangeofmethodsusedincollectingdatafordifferenttimeperiods.译文:我们采用更广泛的纵向研究定义主要是基于以下两点原因:首先,关于纵向研究的构成目前尚未达成共识;其次,我们也考虑到所有研究方法的不同特征在收集不同时间周期数据中的有效性。7 华中科技大学硕士学位论文2)原文:Theseincludetheuseofdummyvariableregressionanalysiswithcertainrestrictiveassumptionsabouttheparametersinthemodel(Masonetal.,1973)andtherecombinationandapriorieliminationofoneormoreofthethreetypesofeffects(Palmore,1978).Theseattempts,particularlythedummyvariableregressionmodel,havegeneratedconsiderablemethodologicalcontroversy(Baltesetal.,1979;Glenn,1976and1977;KnokeandHout,1976;Masonetal.,1973;Rodgers,1982aand1982b;Smithetal.,1982)regardingtheplausibilityoftheassumptionsandtheconsequencesofviolatingtheassumptionsneededtodealwiththeproblemoflineardependenceamongage,period,andbirthcohort.译文:这些措施包括使用某些限制性假设的虚拟变量回归分析模型(Mason等,1973),以及三种影响类型的一个或多个的重组和先验消除(Palmore,1978)。这些尝试,尤其是虚拟变量回归分析模型,已在关于该假设的合理性和违反需要的假设去处理年龄、时期和组群间的线性关系问题导致的后果方面,产生了很大的方法论上的争议(Baltes等,1979;Glenn,1976及1977;Knoke和Hout,1976;Mason等,1973;Rodgers,1982a及1982b;Smith等,1982)。3)原文:Twoquestionsareimportanthere.First,canonevariablemeasuredatonestageofarespondent’slifebeequatedwithaconceptuallysimilarvariable(e.g.,stressinfamilyoforientationandstressinfamilyofprocreation)atalaterstage?Second,isthetransitionabruptorgradual?Dorespondentsundergoaperiodwheninvolvementinbothcontextsisimportant(e.g.,workingandgoingtoschoolatthesametime),oristhechangeanabruptonethatinvolvescompletelyleavingonecontextandimmersingoneselfintheother?译文:这里有两个重要问题。首先,受访者生命的某一阶段测量的变量能否等同于其后人生阶段概念上的一个类似的变量(如,在原始家庭中的压力与在延生家庭中的压力)?其次,过渡是突然进行的还是逐渐进行的?受访者经历了一次两个环境都很重要的时期(如,在同一时期既工作又上学),还是该变化是突然的,受访者完全摒弃一个环境而全身心地投入另一环境之中?8 华中科技大学硕士学位论文4)原文:Otherreasonsforchangesininstrumentationincludenewhypotheses,eitherfromthestudyitselforfromgeneraladvancesintherelevantfieldsofsocialscience,andchangesinresearchstaffandtheirrespectiveinterests(WallandWilliams,1970).译文:改变测量方法的其它原因包括新的假说的出现,不论是从研究本身得出的,还是基于社会科学相关领域的一般发展,同时还包括研究人员和他们各自的研究兴趣的变化(Wall和Williams,1970)。5)原文:Stage-stateanalysismaynotalwaysbeafeasibleapproachtotheexaminationoftemporalorcausalorder.Insomeinstances,theprocessorrelationshipbeinginvestigatedhasbeenongoingforalongtime,anditisnotpossibletocollectdataononset.Thisisaproblemofleft-handcensoring,thefailuretodetectwhenachangehasoccurredbecauseithappenedbeforethefirstperiodforwhichdatawerecollected.Alternatively,thevariablesbeinganalyzedmayhavenomeaningfulonsetorsuspension.译文:阶段状态分析可能永远不会是检测时间和因果次序的一个可行的方法。在某些情况下,被调查的过程或关系已持续了一段很长的时间,所以收集其刚发生时候的数据就几乎是不可能的了。这是一个有关左手审查的问题,未能发现发生的变化是因其发生在数据收集的初始时期之前。此外,分析中的变量可能没有任何有意义的开始或结束。6)原文:Forprobabilitysamplesofthepopulationwithadequatenumbersofcasesineachgroup,thisshouldposelittleproblemaslongassamplingandtheadministrationofthedatacollectionarestrictlyreplicated,butanydeviationfromtheoriginalsamplingoradministrationproceduresmayseriouslycompromisethecomparabilityofthedataandmayrendertherepeatedcross-sectionaldatauselessforlongitudinalanalysis(Martin,1983).译文:对于各组实例数量充足的人口概率抽样,只要采样和数据收集管理保持严格一致的话,这应该是问题不大的,但原始采样或管理程序的任何偏差都可能严重危害数据的可比性,而且有可能导致在纵向分析中重复横向数据不可用(Martin,1983)。9 华中科技大学硕士学位论文7)原文:Ingeneral,themorepriorvaluesoftheendogenousvariableareintheequation,thegreateristhelikelihoodofrejectingthehypothesisofGrangercausality,buttheinclusionofadditionalvaluesoftheendogenousvariablemayhavenosignificanteffectbeyondsomenumber.译文:一般情况下,方程内的内衍变量的较前值与格兰杰因果关系假设产生冲突的可能性更大,而纳入内衍变量的附加值也只能产生一定数量的影响,并无重大影响。8)原文:Intheinitialtest,theresultsindicatedthatthemodeldidagoodjobofexplainingdelinquencyanddruguse,butapoorerjobofexplainingmentalhealthproblems.译文:在开始的测试中,结果表明该模型在解释不良行为和吸毒方面表现很好,但在解释心理健康问题方面却不太好。9)原文:Thisnumbermaybeestimatedbymodelingtheendogenousvariableasanautoregressivetimeseries,orbycalculatingseparateordinaryleast-squaresregressionmodelsandexaminingthechangeintheexplainedvariance(R2)producedbytheinclusionofeachadditionallaggedendogenousvariable(e.g.,bytheadditionofYi-4).lfthereisnostatisticallysignificantchangeintheexplainedvariance(see,e.g.,thetestsuggestedinAgrestiandFinlay,1986:372-375),therewouldseemtobelittlepointinincludingthistermintheequation.译文:该具体数量可通过把内衍变量模拟为自回归时间序列估计,或者通过计算单独的普通最小二乘回归模型、或是检验纳入各个附加的滞后内衍变量(如,Yi-4的纳入)后产生的可释方差(R2)的变化来估计。如果可释方差没有统计上的重要变化(参见Agresti和Finlay提出的测试,1986:372-375),那么把上述术语纳入方程似乎就没有意义了。结合本次翻译项目的文体特征,我在翻译的时候并未对译文进行过多的艺术加工,主要是在传递原文内容的同时,尽可能的尊重原文的结构形式。然而,在提交译文后,翻译公司的两名审校人员还是标注出了一些他们认为有问题的译文。本着10 华中科技大学硕士学位论文批评与自我批评的精神,更是为了发现问题、解决问题,以促进自身翻译水平的不断进步,我仔细通读了他们的批评意见,同时对照我的原译文,尝试着用翻译等值理论评价标准对他们认为有问题的译文进行详细分析,探究问题出在何处、找出问题出现的原因,并在此基础上对我的原译文进行尝试性修正。4.3用翻译等值理论评价译文质量从4.1.2中关于翻译等值理论的讨论可以看出,“形式对等”和“读者反应对等”可以概括为翻译等值理论的两大核心内容,也是评价一个译文是否成功的主要标准。本文将从翻译等值理论出发,站在翻译审校的视角对我的原译文翻译质量进行分析;同时,结合翻译公司两名翻译审校的修改意见,对其进行尝试性修正。1)原文:Ourreasonsforusingabroaderdefinitionoflongitudinalresearchare,first,thelackofconsensusregardingwhatconstituteslongitudinalresearch,andsecond,theusefulnessofconsideringthedifferentfeaturesofthefullrangeofmethodsusedincollectingdatafordifferenttimeperiods.原译文:我们采用更广泛的纵向研究定义主要是基于以下两点原因:首先,关于纵向研究的构成目前尚未达成共识;其次,我们也考虑到所有研究方法的不同特征在收集不同时间周期数据中的有效性。分析:“我们也考虑到所有研究方法的不同特征在收集不同时间周期数据中的有效性”该句的翻译是对“theusefulnessofconsideringthedifferentfeaturesofthefullrangeofmethodsusedincollectingdatafordifferenttimeperiods”比较明显的直译,译文的句子成分与原文基本是一一对应的,满足了形式对等的要求。并且在内容上也不存在漏译或是误译的情况。但是,该句译文因为过多地局限于原文结构导致了意思表达混乱,读起来比较拗口,不利于读者的意思理解,因而不能有效传达原文意思,不能满足读者反应对等的要求。改译:我们采用更广泛的纵向研究定义主要是基于以下两点原因:首先,关于纵向研究的构成目前尚未达成共识;其次,不同时期的各种数据收集方法的不同特征是否都应予以考虑。11 华中科技大学硕士学位论文2)原文:Theseincludetheuseofdummyvariableregressionanalysiswithcertainrestrictiveassumptionsabouttheparametersinthemodel(Masonetal.,1973)andtherecombinationandapriorieliminationofoneormoreofthethreetypesofeffects(Palmore,1978).Theseattempts,particularlythedummyvariableregressionmodel,havegeneratedconsiderablemethodologicalcontroversy(Baltesetal.,1979;Glenn,1976and1977;KnokeandHout,1976;Masonetal.,1973;Rodgers,1982aand1982b;Smithetal.,1982)regardingtheplausibilityoftheassumptionsandtheconsequencesofviolatingtheassumptionsneededtodealwiththeproblemoflineardependenceamongage,period,andbirthcohort.原译文:这些措施包括使用某些限制性假设的虚拟变量回归分析模型(Mason等,1973),以及三种影响类型的一个或多个的重组和先验消除(Palmore,1978)。这些尝试,尤其是虚拟变量回归分析模型,已在关于该假设的合理性和违反需要的假设去处理年龄、时期和组群间的线性关系问题导致的后果方面,产生了很大的方法论上的争议(Baltes等,1979;Glenn,1976及1977;Knoke和Hout,1976;Mason等,1973;Rodgers,1982a及1982b;Smith等,1982)。分析:本句中,“theuseofdummyvariableregressionanalysiswithcertainrestrictiveassumptionsabouttheparametersinthemodel”翻译成“使用某些限制性假设的虚拟变量回归分析模型”存在比较明显的误译,不能正确传递原文意思,当然更不能在读者中引起与原文一样的反应与共鸣。“…andtherecombinationandapriorieliminationofoneormoreofthethreetypesofeffects”翻译成“三种影响类型的一个或多个的重组和先验消除”是很明显的误译,原因在于未能准确分析上下文语境导致了将“therecombination”与“apriorielimination”看成了并列成分,但事实上,“therecombination”是与后面的“apriorieliminationofoneormoreofthethreetypesofeffects”整个意思并列的。因此,本句的翻译既不能满足形式对等的要求,也不能在读者中引起与原文一致的读者反应。此外,“已在关于该假设的合理性和违反需要的假设去处理……”该句中,“违反需要的假设”一说欠缺科学文本用词应有的准确度,不能对原文意思进行正确传递,因而也不能与原文达成反应对等。12 华中科技大学硕士学位论文改译:这些措施包括使用虚拟变量回归分析,同时限制模型中关于参数的某些假设(Mason等,1973),以及重组或事先去除三种影响类型中的一个或多个(Palmore,1978)。这些方法,尤其是虚拟变量回归分析模型,在方法论上是相当具有争议性的,包括该假设的合理性和违背设定的假设去处理年龄、时期和组群间线性关系的问题而导致的后果(Baltes等,1979;Glenn,1976及1977;Knoke和Hout,1976;Mason等,1973;Rodgers,1982a及1982b;Smith等,1982)。3)原文:Twoquestionsareimportanthere.First,canonevariablemeasuredatonestageofarespondent’slifebeequatedwithaconceptuallysimilarvariable(e.g.,stressinfamilyoforientationandstressinfamilyofprocreation)atalaterstage?Second,isthetransitionabruptorgradual?Dorespondentsundergoaperiodwheninvolvementinbothcontextsisimportant(e.g.,workingandgoingtoschoolatthesametime),oristhechangeanabruptonethatinvolvescompletelyleavingonecontextandimmersingoneselfintheother?原译文:这里有两个重要问题。首先,受访者生命的某一阶段测量的变量能否等同于其后人生阶段概念上的一个类似的变量(如,在原始家庭中的压力与在延生家庭中的压力)?其次,过渡是突然进行的还是逐渐进行的?受访者经历了一次两个环境都很重要的时期(如,在同一时期既工作又上学),还是该变化是突然的,受访者完全摒弃一个环境而全身心地投入另一环境之中?分析:此段译文存在三个问题。首先,将“onestageofarespondent’slife”翻译成“受访者生命的某一阶段”是比较严格的直译,译文与原文的各个句子成分是一一对应的,符合形式对等的要求。但是,“受访者生命的某一阶段”这样的表达不符合译文语言的表达习惯,因此很难达到与原文一致的读者反应。其次,将“undergoaperiodwheninvolvementinbothcontextsisimportant”翻译成“经历了一次两个环境都很重要的时期”属于比较明显的逐字翻译,保留了原文的结构形式达到了形式对等,但是结合上下文语境,将“contexts”翻译成“环境”这一译法在内容上与原文是不对等的,并且“一次……时期”这样的表达也不符合译文语言的表述习惯,不能被读者及时看懂。最后,将“completelyleavingonecontext”译成“完全摒弃一个13 华中科技大学硕士学位论文环境”也是属于对原文的简单逐字翻译,虽然形式上与原文达到了对等的要求,但是译文表达上存在很明显的英译过来的痕迹,而且“摒弃环境”这一译法并不符合译文语言的表达习惯,所以很难在译文读者中产生与原文读者对等的反应。改译:这里有两个重要问题。首先,受访者某一人生阶段测量的变量能否等同于其后人生阶段相近概念的另一个变量(如,在原始家庭中的压力与在延生家庭中的压力)?其次,过渡是突然进行的还是逐渐进行的?受访者是否在同一时期经历了两个重要事件(如,在同一时期既工作又上学),还是该变化是突然的,受访者完全离开一个然后再进行另一个?4)原文:Otherreasonsforchangesininstrumentationincludenewhypotheses,eitherfromthestudyitselforfromgeneraladvancesintherelevantfieldsofsocialscience,andchangesinresearchstaffandtheirrespectiveinterests(WallandWilliams,1970).原译文:改变测量方法的其它原因包括新的假说的出现,不论是从研究本身得出的,还是基于社会科学相关领域的一般发展,同时还包括研究人员和他们各自的研究兴趣的变化(Wall和Williams,1970)。分析:首先,原文是个并列句,主语是“Otherreasonsforchangesininstrumentation”,谓语是“include”,而“newhypotheses”和“changesinresearchstaffandtheirrespectiveinterests”是并列宾语。本句的难点在于对“eitherfromthestudyitselforfromgeneraladvancesintherelevantfieldsofsocialscience”这一插入语在译文中的处理。原译文在处理时是完全遵照原文的句子结构,采取的是基本直译的翻译策略,与原文达成了形式对等。但是,从译文语言的表达习惯来看,“不论是从研究本身得出的,还是基于社会科学相关领域的一般发展”这一插入语放在前后两个并列宾语之间,会对整个句子在意思表达上造成断层,不利于读者的即时理解,所以在读者反应对等方面原译文仍存在一定的问题。改译:改变测量方法的其它原因包括,研究本身或与社会科学相关的领域出现了新的假说,同时还包括研究人员转变了他们的研究兴趣(Wall和Williams,1970)。5)原文:Stage-stateanalysismaynotalwaysbeafeasibleapproachtotheexaminationoftemporalorcausalorder.Insomeinstances,theprocessorrelationship14 华中科技大学硕士学位论文beinginvestigatedhasbeenongoingforalongtime,anditisnotpossibletocollectdataononset.Thisisaproblemofleft-handcensoring,thefailuretodetectwhenachangehasoccurredbecauseithappenedbeforethefirstperiodforwhichdatawerecollected.Alternatively,thevariablesbeinganalyzedmayhavenomeaningfulonsetorsuspension.原译文:阶段状态分析可能永远不会是检测时间和因果次序的一个可行的方法。在某些情况下,被调查的过程或关系已持续了一段很长的时间,所以收集其刚发生时候的数据就几乎是不可能的了。这是一个有关左手审查的问题,未能发现发生的变化是因其发生在数据收集的初始时期之前。此外,分析中的变量可能没有任何有意义的开始或结束。分析:首先,纵观全段,原译文采取的是适用于本翻译项目文体的基本直译翻译方法,很好地保留了原文的句子结构形式,符合了翻译等值理论中的形式对等要求。但是,在细节处理方面,原译文仍存在一些问题。例如,将“maynotalwaysbe”翻译为“可能永远不会是”就是非常明显的误译,与科学文本用词的准确性严重不符,因而完全不能读者反应对等的要求。其次,将“left-handcensoring”译为“左手审查”也欠妥当,未能对原文意思进行有效传递。此外,将“mayhavenomeaningfulonsetorsuspension”译为“可能没有任何有意义的开始或结束”,这里的“可能没有有”句式读起来比较绕口,表达清晰度上也有所欠缺,未能正确传递原文意思,更谈不上获得与原文一致的读者反应了。改译:用阶段状态分析来检测时间和因果次序并不总是可行的。在某些情况下,调查过程或关系已持续了一段很长的时间,所以收集其刚发生时候的数据就几乎是不可能的了。这就是左侧删失的问题,即,因其发生在数据收集的初始时期之前,故而未能检测到。此外,用来分析的变量可能具有无意义的开始或结束。6)原文:Forprobabilitysamplesofthepopulationwithadequatenumbersofcasesineachgroup,thisshouldposelittleproblemaslongassamplingandtheadministrationofthedatacollectionarestrictlyreplicated,butanydeviationfromtheoriginalsamplingoradministrationproceduresmayseriouslycompromisethecomparabilityofthedataandmayrendertherepeatedcross-sectionaldatauselessforlongitudinalanalysis(Martin,15 华中科技大学硕士学位论文1983).原译文:对于各组实例数量充足的人口概率抽样,只要采样和数据收集管理保持严格一致的话,这应该是问题不大的,但原始采样或管理程序的任何偏差都可能严重危害数据的可比性,而且有可能导致在纵向分析中重复横向数据不可用(Martin,1983)。分析:总体看来,原译文在翻译本段的时候采取的是基本直译法,符合本翻译项目的文体翻译策略要求。同时,在形式上,原译文基本保留了原文的语句结构形式,符合了翻译等值理论的形式对等要求。但是,原译文最大的问题在于“……的话”的使用,以及“这应该是问题不大的”这样明显口语化的表达。作为一项学术理论著述,原文使用的是偏正式且客观的语言,读者在阅读的时候感受到的也是文章的科学性和客观性。但是,原译文的处理方式就不能让读者很好地感受到原翻译项目的文体特征,从而不能达到翻译等值理论的读者反应对等要求。改译:对于各组实例数量充足的人口概率抽样,只要采样和数据收集管理保持严格一致就没有大问题,但原始采样或管理程序的任何偏差都可能严重危害数据的可比性,而且有可能导致在纵向分析中重复横向数据不可用(Martin,1983)。7)原文:Ingeneral,themorepriorvaluesoftheendogenousvariableareintheequation,thegreateristhelikelihoodofrejectingthehypothesisofGrangercausality,buttheinclusionofadditionalvaluesoftheendogenousvariablemayhavenosignificanteffectbeyondsomenumber.原译文:一般情况下,方程内的内衍变量的较前值与格兰杰因果关系假设产生冲突的可能性更大,而纳入内衍变量的附加值也只能产生一定数量的影响,并无重大影响。分析:从整体看,通观整个句子,原译文采用基本直译的翻译策略较好了保留了原文的句子结构,达到了翻译等值理论的形式对等要求。但原译文在两处地方的处理上仍欠妥当。首先,将“themorepriorvaluesoftheendogenousvariable”翻译成“方程内的内衍变量的较前值”是比较明显的逐字翻译,从“themorepriorvalues”到“较前值”的转换完全是字面翻译,不符合译文语言环境的表达习惯,同时对读16 华中科技大学硕士学位论文者来说也不能获得即时的理解,达不到与原文一致的读者反应。其次,将“buttheinclusionofadditionalvaluesoftheendogenousvariablemayhavenosignificanteffectbeyondsomenumber”译为“而纳入内衍变量的附加值也只能产生一定数量的影响,并无重大影响”就是由于过度拘泥于本句语言结构,从而未能准确理解前后文语境,进而造成的理解偏差导致误译的发生。纵观整个句子,“but”前后的句子成分的主干都是“values”,呈并列关系。因此,在“buttheinclusionofadditionalvaluesoftheendogenousvariablemayhavenosignificanteffectbeyondsomenumber”这一语境中,“beyondsomenumber”修饰的应该是“additionalvalues”,而并非原译文中理解的“effect”。原译文对原文的理解存在偏差,进而使其在读者反应上不能达到与原文的对等效果。改译:一般情况下,方程内的内衍变量越早的数值与格兰杰因果关系假设产生冲突的可能性更大,而当它纳入内衍变量的附加值超过一定数量时,可能就没有显著的影响。8)原文:Intheinitialtest,theresultsindicatedthatthemodeldidagoodjobofexplainingdelinquencyanddruguse,butapoorerjobofexplainingmentalhealthproblems.原译文:在开始的测试中,结果表明该模型在解释不良行为和吸毒方面表现很好,但在解释心理健康问题方面却不太好。分析:本句译文存在两大问题。首先,将“Intheinitialtest,theresultsindicatedthat”处理成“在开始的测试中,结果表明”,这一译法过度拘泥于原文结构,采取的是完全逐字直译的翻译方法,虽然因为较好地保留了原文语句结构满足了翻译对等理论中的形式对等要求,但是,“在开始的测试中”这一表达不符合学术理论著述应有的正式性和严谨性,同时,“在开始的测试中,结果表明”这一表达也存在着明显的语法错误,“测试结果表明”这样的表达才符合译文语言表达习惯。因此,该译文不仅在内容上不能达到与原文一致的对等效果,进而使得在读者反应上不能引起与原文一致的共鸣。其次,将“didagoodjobof…,butapoorerjobof”翻译为“在……方面表现很好,但在……方面却不太好”是典型的口语化表达,未能符合学术理论著述应17 华中科技大学硕士学位论文有的正式性,所以未能与原文达到一致的读者反应。改译:初期结果显示,该模型能很好解释不良行为和吸毒,但不能很好解释心理健康问题。9)原文:Thisnumbermaybeestimatedbymodelingtheendogenousvariableasanautoregressivetimeseries,orbycalculatingseparateordinaryleast-squaresregressionmodelsandexaminingthechangeintheexplainedvariance(R2)producedbytheinclusionofeachadditionallaggedendogenousvariable(e.g.,bytheadditionofYi-4).lfthereisnostatisticallysignificantchangeintheexplainedvariance(see,e.g.,thetestsuggestedinAgrestiandFinlay,1986:372-375),therewouldseemtobelittlepointinincludingthistermintheequation.原译文:该具体数量可通过把内衍变量模拟为自回归时间序列估计,或者通过计算单独的普通最小二乘回归模型、或是检验纳入各个附加的滞后内衍变量(如,Yi-4的纳入)后产生的可释方差(R2)的变化来估计。如果可释方差没有统计上的重要变化(参见Agresti和Finlay提出的测试,1986:372-375),那么把上述术语纳入方程似乎就没有意义了。分析:纵观全段,原译文是根据本翻译项目的文体要求,主要采取的是基本直译的翻译策略,在语句结构上基本是遵照原文来进行编排的,所以基本达到了翻译等值理论的形式对等要求。但是,原译文在三个地方的处理上未能完全满足翻译等值理论的两个个要求。首先,原译文第一小句的处理就存在问题。将“Thisnumbermaybeestimatedbymodelingtheendogenousvariableasanautoregressivetimeseries”翻译为“该具体数量可通过把内衍变量模拟为自回归时间序列估计”,看上去似乎是完全遵照原文进行的意思传递,但如果仔细考究译文的语法结构就会发现,在该小句中,“该具体数量”用作主语,“可通过把内衍变量模拟为自回归时间序列”用作方式状语,“估计”用作谓语动词,如果将句子成分进行精简,得出的就是“数量可通过……估计”,而这在译文的语言表达中并不构成一个完整的句子。所以,本句的翻译未能正确传递原文意思,不能达到与原文读者反应对等的效果。其次,将“lfthereisnostatisticallysignificantchangeintheexplainedvariance”译为“如果可释方差没有统计18 华中科技大学硕士学位论文上的重要变化”是比较明显的误译,究其原因在于译者出于专业限制导致的对“nostatisticallysignificantchange”的理解错误。此处的“significant”应作“显著的”解释,而不是原译文理解的“重要的”之意。最后,将最后一小句“therewouldseemtobelittlepointinincludingthistermintheequation”中的“thisterm”翻译为“这一术语”,虽然在字面意思上不存在错误,但带入整个译文语境就会发现,“这一术语”前面既有“内衍变量”又有“可释方差”,如果只简单地把“thisterm”翻译为“这一术语”,很可能就会对读者造成理解困难,阻碍其获得即时的理解体验。因此,虽然本段的翻译基本满足了翻译等值理论的形式对等要求,但由于存在理解和表达上的一些问题,原译文在读者反应上仍未能获得与原文一致的对等效果。改译:该具体数量可通过把内衍变量模拟为自回归时间序列进行估计,或者通过计算单独的普通最小二乘回归模型、或是检验纳入各个附加的滞后内衍变量(如,Yi-4的纳入)后产生的可释方差(R2)的变化来估计。如果可释方差没有显著性(参见Agresti和Finlay提出的测试,1986:372-375),那么把该项变量纳入方程似乎就没有意义了。19 华中科技大学硕士学位论文5总结5.1翻译实践中未解决的问题及相关思考翻译实践中,困扰我最大的一个问题就是跨专业翻译的专业限制。我本科学习的是英语专业,同时还学习过会计学双学位,接受过为期两年半的专业训练,所以在商务翻译方面,比起没有经管方向知识背景的同学会顺手一些。但对于诸如本翻译项目描述的纵向研究等其它专业领域的知识只有表层了解,因为欠缺专业知识,所以翻译起来容易因为理解不透彻而误译,或是用词不准确或表达不当,从而影响整个译文的翻译质量。参考一些前辈的相关文章,同时结合我自身的实践经验,我深深认可专门化翻译的可行性。我认为,在翻译硕士专业内部分化不同指向性的专门化翻译方向,并开设相应的普及性课程,如医学、建筑、水利等,可以大大优化翻译硕士学生某些方向的翻译水平,从而提高其在该类方向的竞争力。5.2对今后学习工作的启发及展望通过此次翻译实践,结合两年来的学习体会,我认识到了一名职业翻译应有的素养。首先,想要成为一名称职的翻译,不仅需要有扎实的语言功底,不断提高自身的专业素养;还需要成为一个“杂家”,了解并掌握诸如金融、法律、医学、建筑等其它领域的相关知识,以提高对各专业源文本的理解程度,熟悉各专业文章的文体特征和措辞习惯,以保证译文的翻译质量。其次,一名称职的翻译也需要充分考虑客户需求,能够与客户进行良性沟通,就翻译中遇到的专业问题良好讨论。同时,也需要站在读者的角度,考虑到目标读者的接受层次和需求。此外,一名称职的翻译还需要保持并提高自省能力,既要知道用翻译理论指导翻译实践,还需要根据具体的翻译项目运用恰当的翻译评价标准来衡量自己的译文,20 华中科技大学硕士学位论文分析译文中出现的问题并探索解决办法,以期不断提高自己的翻译水平,改善自己的翻译技巧。最后,还有很关键的一点就是时间观念。一般每个稿件最开始都会有明确的时间限制。译者在接稿时,需要衡量自身能力与精力,有把握能按时完成才能接稿。接稿后,也需要考虑到突发状况的可能性,在保证翻译质量的同时,合理安排翻译进度。21 华中科技大学硕士学位论文参考文献[1]Catford,J.C.ALinguisticTheoryofTranslation:AnEssayinAppliedLinguistics[M],Oxford/London:OxfordUniversityPress,1965[2]Jakobson,R.OnLinguisticAspectsofTranslation[A].InReubenBrower(ed.),OnTranslation[C].NewYork:OxfordUniversityPress,1959/1966[3]KennethR.OneHundredPoemsfromtheChinese[M].NewYork:NewDirections,1959[4]Nida,E.A.TowardaScienceofTranslating[M].Leiden:E.J.Brill,1964[5]Nida,E.A.andTaber,C.R.TheTheoryandPracticeofTranslation[M].Leiden:E.J.Brill,1969[6]Nida,E.A.anddeWaar,Jan.FromOneLanguagetoAnother:FunctionalEquivalenceinBibleTranslation[M].Nashville:ThomasNelsonPublishers,1986[7]Shuttleworth,M.andM.Cowie.DictionaryofTranslationStudies[M],Manchester:St.JeromePublishing,1997[8]连淑能.英译汉教程[M].北京:高等教育出版社,2009.[9]刘宓庆.文体与翻译[M].北京:中国对外翻译出版公司,1998.[10]穆雷.翻译硕士专业学位论文模式探讨[J],外语教学理论与实践,2011(1):77-82.[11]穆雷,邹兵,杨冬敏.翻译硕士专业学位论文参考模板探讨[J],学位与研究生教育,2012(4):24-30.[12]王佐良.翻译:思考与试笔[M].北京:外语教学与研究出版社,1989.22 华中科技大学硕士学位论文致谢作为华科大招收的第一届翻译硕士学生,我深感荣幸。华科大外国语学院各位老师的悉心教育,让我增长了见识、开阔了视野、丰富了人生。感谢我的导师王树槐教授,他对我生活与学习的关心让我感动,他对学术的孜孜以求令我折服,并将成为我一生的学习榜样。感谢华科大外国语学院翻译硕士专业的各位老师,他们渊博的知识让我受益匪浅。感谢翻译硕士专业的各位同学,两年来我们一同上课、讨论翻译项目、分享翻译心得,是同学,更是朋友。感谢给我实习机会的世语翻译公司。感谢我的室友和我的家人。23 华中科技大学硕士学位论文附录1:术语表English中文casualorder因果次序casualrelationship因果关系clusteranalysis聚类分析cohort组群cohorteffect组群效应cross-sectionalresearch横向研究dependentvariable因变量differenceequation差分方程functionalequation函数方程gametheory博弈论intentionality指向性linearfunction线性函数longitudinaldata纵向数据longitudinalpaneldesign纵向追踪设计longitudinalresearch纵向研究matrice矩阵not-quite-longitudinaldesign非典型纵向设计panelattrition追踪损耗parameter参数period时期qualitativechange质变quantitativechange量变rawgain初始增益regressionparameter回归参数repeatedcross-sectionaldesign重复横向设计residualgain残差增益respondent受访者respondentrecall受访者回忆revolvingpaneldesign循环追踪设计serendipity偶然性temporalorder时间次序time-seriesanalysis时间序列分析totalpopulationdesign总人口设计24 华中科技大学硕士学位论文附录2:翻译项目原文SERIESEDITOR"SINTRODUCTIONLongitudinalresearchconcernsthecollectionandanalysisofdataovertime.Inprinciple,thesamevariablesaremeasuredonthesameunitsofanalysisforatleasttwotimeperiods.Assuch,itmarksitselfofffromcross-sectionalresearch,wherethedataaregatheredatonepointintime.Atypicalcross-sectionalexampleisthepublicopinionsurvey,withasampleofrespondents(from,say,thevotingpopulation)interviewedmoreorlesscontemporaneously.Incontrast,alongitudinallydesignedsurveymightinterviewthissamesampleofvoterstwice,attwodifferentelectionperiods(thusformingatwo-wavepanelstudy).Becausebothdesigns-longitudinalandcross-sectional-arcnon-experimental,questionsofcausalinferencearealwaysquitecomplex.However,longitudinalworkoffersamajoradvantageinthatregard,sincethetemporalorderingofarelationshipmaybearguedwithmorecertitude.Thatis,whenYisshownactuallytooccurafterX,wegainconfidencethatX"causes"orsomehow"influences"Y.Letahypotheticalexampleclarifythispoint.SupposeDr.MaryWhite,criminaljusticescholar,wishestotestthehypothesisthat"agingmakespeoplemorefearfulofcrime."Therefore,sheconductsavictimizationsurveyof1000randomlychosenGothamCityadults,allinterviewedinamonthperiod(labeledtimet1).Analyzingtheresponses,shefindsX(ageofrespondent)stronglycorrelateswithY(afearofcrimeindex).Nevertheless,sheavoidsthesimpleconclusionthatagingmakespeoplemorefearfulofcrime.Instead,shesuspectsthattherelationshipbetweenXandYisspurious,aproductofthecommonrelationshipofactualcrimeexperience(Z)toboth.Thatis,olderpeoplearemorelikelytohavebeenvictimsofcrime,andthosewhohavebeenvictimsaremorelikelytobefearful.Dr.Whitenowconductstwoothersurveys(addingmoreitemsonspecificrecentvictimizations)withthesame25 华中科技大学硕士学位论文sample,at12andsixmonthslateratt3.Shefindsastrongcorrelationbetweenearliercrimeexperience(at12)andlaterfearofcrime(att3).Moreover,thiscorrelationremainsstrongwithineachagecohort(young,middle,old).Thesepanelresultsfavortheconclusionthatvictimizationitself,ratherthantheagingprocess,leadstofearofcrime.Ofcourse,otherproblemshaveyettobeconsidered–respondentattrition,recallbias,possiblespuriousnessfromothersources.However,thepanelstudyhasmovedProf.Whiteclosertosortingoutthedeterminantsoffearofcrime.Theaboveillustrationofalongitudinaldesignwasinspiredbyoneofthemanywell-chosenrealdataexamplesprovidedherebyDr.Menard,Hehasselectedcarefullyfromyouthsurveys,crimesurveys,electionsurveys,andfertilitystudies,tonameafew.Theseexampleshelptheresearchworkerunderstandthemethodsforgatheringlongitudinaldata,atopicengaginglydiscussedinthefirstpartofthemonograph.Then,issuesintheproblemsoflongitudinalanalysisarcintroduced.Forinstance,theknottyquestionofhowtomeasurechange-differences,residuals,orlag..<;-isposed.But,Dr.Menardgivesthereaderanappreciationofopportunitiesaswellasdifficulties,andoutlinesseveralpromisinganalyticstrategies,Afterfinishingthismonograph,studentsshouldfeelencouragedtolaunchtheirownlongitudinalresearchproject.--MichaelS.Lewis-BeckLONGITUDINALRESEARCHSCOTTMENARD1.INTRODUCTIONLongitudinaldatahavebeencollectedatthenationallevelformorethan300years,beginningwiththeperiodiccensusestakenbyNewFrance(Canada)andcontinuedinQuebecfrom1665until1754.Thesewerenotthefirstcensuses,buttheydidrepresentthefirstperiodiccollectionofcensusdata,asopposedtosingleisolatedcensusestakenat26 华中科技大学硕士学位论文irregularintervals.ThelatterbeganasearlyastheIsraelitecensusof1491B.C.(Tomlinson,1976).OtherperiodiccensusesthathavecontinuedtothepresentincludethoseofSwedensince1749,NorwayandDenmarksince1769,andtheUnitedStatessince1790.TheUnitedStatesisexceptionalamongnationsbecauseithaslongitudinalcensusdatafromthefirstdecadeofitsexistenceasanationuptothepresent.Attheindividuallevel,BaltesandNesselroade(1979)andWallandWilliams(1970)cite-collectionoflongitudinaldata(primarilycasestudyandbiographicaldata)asearlyas1759.Long-termstudiesofchildhooddevelopmentinvolvingmultiplesubjectsflourishedintheUnitedStatesafterWorldWarI,andabroadarrayoflongitudinalstudiesinthesocialandbehavioralscienceshasbeenundertakeninthe1970sand1980s.Theproliferationoflongitudinalresearchatteststoitsperceivedimportancebybothresearchersandmajorfundingagencies.Whenquestionshavebeenraisedaboutthevalueoflongitudinalresearch,thosequestionshavemoreoftenaddressedthequalityoftheresearchintermsofdesignandanalysisthanthevalueoflongitudinalresearchinprincipleforansweringquestionsthatcannotadequatelybeaddressedbyothertypesofdata-collectiondesignsandanalysis.Theuseoflongitudinaldataandmethodshasrecentlybecomequitefashionable,andformany,longitudinalresearchistoutedasapanaceaforestablishingtemporalorder,measuringchange,andmakingstrongercausalinterpretations.Althoughthereareindeedcertainadvantagesassociatedwiththesemethods,thereareoffsettingcostsanddifficulties,Longitudinalresearchmaynotalwaysbenecessaryevenforestablishingcausalorder(Davis,l985;Blalock,1962),particularlywhenthetemporalorderofvariablesisknowninadvance(forexample,biologicalorgeneticcharacteristicssuchassex,race,andage),andlongitudinaldataarccertainlynotacureforweakresearchdesignanddataanalysis._____________________________________AUTHOR"SNOTE:IwouldliketothankDelbertS.Ellionandtwoanonymousreviewersfortheirsuggestions.andZekeLittlefortheoriginalgraphicsusedinthismanuscript.27 华中科技大学硕士学位论文DefinitionInthisdiscussionoflongitudinalresearch,Iusethetermlongitudinaltodescribenotasinglemethod,butafamilyofmethods(Zazzo,1967).Thisfamilyofmethodsisbestunderstoodbycontrastinglongitudinalresearchwithcross-sectionalresearch.Inpurecross-sectionalresearch,measurementoccursonceforeachindividual,subject,country,orcl.lseinthestudy;themeasurementofeachitem,concept,orvariableappliestoasingletimeintervalorperiod;andthemeasurementofeachvariableforeachcaseoccurswithinasufficientlynarrowspanoftime(ideallyitwouldoccursimultaneouslyforeachvariableforeachcase)thatthemeasurementsmayberegardedascontemporaneous,thatis,occurringwithinthesameperiodforallvariablesandforallcases.DependingOntheparticularstudy,aperiodmaybedefinedintermsofseconds,days,months,years,or(inprinciple)geologicalepochs.Inthesocialandbehavioralsciences,periodstypicallyvaryfromminutesinsomelaboratoryexperimentstoyearsinsomecross-nationalresearch.Longitudinalresearchmustbedefinedintermsofboththedataandthemethodsofanalysisthatareusedintheresearch.Longitudinalresearchisresearchinwhich(a)dataarecollectedforeachitemorvariablefortwoormoredistincttimeperiods;(b)thesubjectsorcasesanalyzedarcthesameoratleastcomparablefromoneperiodtothenext;and(c)theanalysisinvolvesanycomparisonofdatabetweenoramongperiods.Atabareminimum,anytrulylongitudinaldesignwouldpermitthemeasurementofdifferencesorchangeinavariablefromoneperiodtoanother.Accordingtothisdefinition,severaltypesofresearchmayheregardedaslongitudinal.Inone,datamaybecollectedattwoormoredistinctperiods,forthosedistinctperiods,onthesamesetofcasesandvariablesineachperiod.Thisisaprospectivepaneldesign.Alternatively,datamaybecollectedatasingleperiod,forseveralperiods,usuallyincludingtheperiodthatendswiththetimeatwhichthedataarecollected.Thisretrospectivepaneldesignmaybeidenticaltoaprospectivepaneldesignineveryrespectexceptthenumberoftimesdatacollectionactuallytakesplaceandthelengthoftherecallperiodrequiredofrespondents.Inbothpaneldesignsthe28 华中科技大学硕士学位论文casesandvariablesremainthesamefromoneperiodtothenext.Athirdpossibilityistocollectdataonthesamesetofvariablesfor(andperhapsat)twoormoreperiods,buttoincludenonidentical(butcomparable)casesineachperiod.Inthisrepeatedcross-sectionaldesign,thedataforeachperiodmayberegardedasaseparatecross-section,butbecausethecasesarecomparablefromoneperiodtoanother(forexample,byusingprobabilitysamplesdrawnfromthesamepopulation),wemaymakecomparisonsbetweenoramongperiods.ThesedifferenttypesoflongitudinaldesignsarepresentedingreaterdetailinChapter3BaltesandNesselroade(1979)andWallandWilliams(1970)havesuggestednarrowerdefinitionsoflongitudinalresearchthatwouldexcludeallexceptprospectivepaneldesigns,buttheyacknowledge(BaltesandNesselroade,1979:4;WallandWilliams,1970:14)thatthereisnoconsensusonthispoint.BaltesandNesselroadesuggestthatlongitudinalresearchmayneedtobedefinedwithinthecontextofaspecificdiscipline.Fordevelopmentalstudiesinpsychology,itmaybeappropriatetoconsideronlylongitudinalpaneldesigns,butinotherdisciplinesthisseemstoorestrictive.Ourreasonsforusingabroaderdefinitionoflongitudinalresearchare,first,thelackofconsensusregardingwhatconstituteslongitudinalresearch,andsecond,theusefulnessofconsideringthedifferentfeaturesofthefullrangeofmethodsusedincollectingdatafordifferenttimeperiods.Theremainderofthismonographisorganizedasfollows.InChapter2,Idiscussthepurposesoflongitudinalresearchandthedifficultiesinvolvedinseparatinghistoricalanddevelopmentalchanges.Chapter3presentsanddiscussesbasicdesignsforthecollectionoflongitudinaldata.InChapter4,Idiscussissuesthatmayaffectthequalityoflongitudinaldata.Finally,abriefintroductiontoandoverviewofmethodsoflongitudinalanalysisispresentedinChapter5.2.THEPURPOSESOFLONGITUDINALRESEARCH29 华中科技大学硕士学位论文Longitudinalresearchservestwoprimarypurposes:todescribepatternsofchange,andtoestablishthedirection(positiveornegative,andfromYtoXorfromXtoY)andmagnitude(arelationshipofmagnitudezeroindicatingtheabsenceofacausalrelationship)ofcausalrelationships.Changeistypicallymeasuredwithreferencetooneoftwocontinua:chronologicaltime(hereaftersimplytime)orage.Timeismeasuredexternallytothecasesorsubjectsbeingstudied(e.g.,2:22P.M,28August1989).Ageismeasuredinternally,relativetothesubjectorcaseunderstudy(e.g.,38years,7months,26days,8hours,and27minutessincebirth).Inonesense,agerepresentsbiologicaltimeforhumansubjects.Thechoiceoftimeorageastheunderlyingcontinuummaybeimportant,andforsomepurposesitmaybeusefultoconsiderbothinthesameanalysis.Alsoimportantisthedistinctionbetweenage-relateddifferenceswhenageismeasuredcross-sectionally(differencesbetweensubjectswhoare40yearsoldandsubjectswhoare50yearsoldin1980)andagemeasuredlongitudinally(differencesbetweensubjectswhoare40yearsoldin1980andthosesamesubjectswhentheyare50yearsoldin1990).Whenageismeasuredcross-sectionally,thedifferencesbetweenvariablesfor40-year-oldsand50-year-oldsmaybeinterpretedasdifferencesbetweenbirthcohortsoragegroupsataparticulartime.Whenageismeasuredlongitudinally,thedifferencesmaybeinterpretedasdevelopmentaldifferenceswithinacohortoragegroupovertime.Age,Period,andCohortEffectsThedistinctionbetweentimeandageasconceptuallydistinctcontinuaalongwhichchangemaybemeasuredcanposeseriousproblemsofinterpretationinthestudyofchange.Tounderstandtheseproblems,andtolayafirmfoundationfordiscussingthemeasurementofhistoricalanddevelopmentalchange,itisnecessarytodiscussthedistinctionsamongage,period,andcohortasvariablesandasunitsofanalysis.ThedemographicdefinitionofacohortisprovidedbyGlenn(1977:8):"Acohortisdefinedasthosepeoplewithinageographicallyorotherwisedelineatedpopulationwhoexperiencedthesamesignificantlifeeventwithinagivenperiodoftime."Asimilar30 华中科技大学硕士学位论文definitionisofferedbyRyder(1965).BothGlennandRydernotethatalthoughthetermcohortisalmostalwaysusedtorefertobirthcohorts(thoseborninaparticularyearorperiod),onemayalsodefinecohortsintermsofyearofmarriageordivorce,yearofretirementorfirstemployment,oryearofoccurrenceofanynumberofeventsotherthanbirth.Gractz(1987)usesthetermeventcohorttodescribecohortsotherthanbirthcohorts.Supposethatwewanttotestthehypothesisthatpeoplebecomepoliticallymoreconservativeastheygrowolder.Oneapproachwouldbetodoasurveyofindividualsofdifferentagesinagivenyear,askquestionsabouttheirpoliticalattitudes,andcompareyoungerrespondentswitholderrespondents.Iftheolderrespondentsreportedbeingmorepoliticallyconservativethantheyoungerrespondents,wemightconcludethatpeopledobecomemoreconservativeastheygetolder,butthereisaplausiblealternativehypothesis.Perhapsthoseinoursamplewhoareolderandmoreconservativewerejustasconservativewhentheywereyounger,andperhapsouryounger,lessconservativerespondentswillremainlessconservativeastheygrowolder.Inotherwords,cross-sectionaldifferencesbyagemaybeconfusedwithdifferencesthatresultnotfromagebutfromtheeffectsofmembershipindifferentbirthcohorts.Putanotherway,differentlifeexperiencesatcertain,perhapsrelativelyyoung,agesmayhavelong-lastingeffectsontheattitudesofdifferentindividuals.Supposenowthatinsteadofdoingacross-sectionalstudy,weselectasinglebirthcohortandinterviewasampleofrespondentsfromthiscohortevery5or10yearsuntiltheydie.Attheendofourstudy,ifwefoundthatrespondentsweremoreconservativewhentheywereolder,wemightconcludethatpoliticalconservatismincreaseswithage.Again,however,thereisaplausiblealternativehypothesis.Itispossiblethatthereisnorealdifferenceamongagegroupsinanyoneyear,butthateveryone,youngandold,isbecomingmoreconservativeovertime,forreasonsthathavenothingtodowithage.Thiswouldsuggestaneffectofhistory,specifictoyearsorperiodsratherthantoages.Putanotherway,contemporaryeventsmayhaveanimmediateeffectonpoliticalconservatism,31 华中科技大学硕士学位论文regardlessofage.Theproblemofaperioddifferencedoesnotariseinthecross-sectionalstudybecausethereisonlyoneperiod.Theproblemofacohortdifferencedoesnotariseinalongitudinalstudybecausethereisonlyonecohort.Sinceneitheracross-sectionalstudynorasingle-cohortlongitudinalstudycaneliminatebothcohortmembershipandperiodeffectsasrivalhypotheses,itwouldseemlogicaltocombinethetwoapproachesanduseamultiple-year,multiple-cohortdesign.Thenwecouldcontrolforbothcohortmembershipandperiodinexaminingtheeffectofageonpoliticalconservatism.Theproblemwiththisisthatifweassumethattheeffectsofage,period,andcohortmembershiparealllinear,controllingforanytwovariablescontrolsforthethirdaswell.Thisisbecauseage,period,andcohortmembership,asmeasuredhere,arelinearlydependent;eachisalinearfunctionoftheothertwo.Mathematically,Cohort(yearofbirth)=period(year)-age(yearssincebirth).Againwearestymiedinourattempttotestthehypothesisthatpoliticalconservatismincreasesasaresultofage.Includingallthree(age,period,andcohort)inaregressionequation,forexample,wouldresultinperfectcollinearity.Anyageeffectwefindwithoutcontrollingforbothperiodandcohortmay,withequalplausibility,beattributabletothecombinedorseparateeffectsofcohortmembershipandtrendsovertime.Thisproblem,alongwithotherproblemsincohortanalysis(sampling,samplemortality,andsoon)isdiscussedinsomedetailinGlenn(1977).LinearDependenceandtheConceptualStatusCohorts.Attemptshavebeenmadetoovercometheproblemoflineardependenceamongage,period,andbirthcohort.Theseincludetheuseofdummyvariableregressionanalysiswithcertainrestrictiveassumptionsabouttheparametersinthemodel(Masonetal.,1973)andtherecombinationandapriorieliminationofoneormoreofthethreetypesofeffects(Palmore,1978).Theseattempts,particularlythedummyvariableregressionmodel,havegeneratedconsiderablemethodologicalcontroversy(Baltesetal.,1979;Glenn,1976and1977;KnokeandHout,32 华中科技大学硕士学位论文1976;Masonetal.,1973;Rodgers,1982aand1982b;Smithetal.,1982)regardingtheplausibilityoftheassumptionsandtheconsequencesofviolatingtheassumptionsneededtodealwiththeproblemoflineardependenceamongage,period,andbirthcohort.Inaddition,thesemethodsdonotsolvetheproblemoflineardependence,becausetheMasonetal.(1973)modelassumesthatnotalloftheeffectsarelinear,andinPalmore"smethod,oneeffectmustbeeliminatedapriori.Theuseofsuchassumptionscouldaseasilybebuiltintoordinaryleast-squaresregressionmodels.Notethattheproblemoflineardependenceappliestobirthcohorts,butnotnecessarilytoothertypesofcohorts.Totheextentthataneventisnotdependentonageorperiod,aneventcohortbasedonthateventisnotlinearlydependentonageorperiod.Insomecases,then,lineardependencemaybeeliminatedapriori.Asecondandmorefundamentalpointregardingage,period,andcohorteffectsisthatcohorts,asaggregatesofindividuals,areunitsofanalysis,casesforstudy.ItisinthissensethatthetermcohortisusedbyRyder(1965)andimplementedinsomestudiesofcohorteffects(e.g.,Carlson,1979;Lloydetal.,1987;Wetzeletal.,1987).Baltesetal.(1979)discussthreepossibleconceptualizationsofcohort(errorordisturbance;dimensionofgeneralization;theoreticalandprocessvariable),oneofwhich(dimensionofgeneralization)correspondstotheuseofcohortsasunitsofanalysis,ratherthanastheoreticalvariables.Evensomestudiesthatusecohortasanexplanatoryvariablealsorecognizecohortasaunitofanalysis(e.g.,WrightandMaxim,1987).Cohortsareaggregatesofindividuals(cases).Ascases,theymaybeanalyzedinthesamewayasothercases(individuals,cities,nations).Insocialscienceresearch,cohorts,likeotheraggregatecases,havemeasurablecharacteristics,someofwhichareinherentlyaggregateinnature(size,sexratio,ethniccomposition)andothersofwhicharesummations(totalnumberofarrests)oraverages(medianlifetimeincome)oftheindividualswhoareincludedinthecohort.Bycontrast,wedonotmeasureaggregatecharacteristicsofagesorperiods,assuch,butwemaymeasureaggregatecharacteristics33 华中科技大学硕士学位论文ofcasesduringaparticularageorperiod.Agesandperiodsareaggregatesoftime,variablesratherthanunitsofanalysis.Theymaybeusedtodelimitthecasesforanalysisinaparticularstudy,buttheyarenotthemselvestypicallyemployedasunitsofanalysisinsocialresearch.Age,period,andbirthcohort,respectively,answerthequestions"howoldareyou?""whatyearisit?"and"inwhatyearwereyouborn?"Theanswertothequestion"howoldareyou?"mayexplainsomeformsofbehavior:Wettingone"spantsismostcommonininfancy,illegalbehaviortendstobehighestinadolescence,andretirementismostcommonafterage65.Ageprovidesadevelopmentalexplanationforbehavior.Theanswertothequestion"whatyearisit?"mayalsohelpexplainsomeformsofbehavior:IntheUnitedStates,useofillicitdrugswasmorecommonafter1960thanbefore,andovertracialdiscriminationwasmorecommonbefore1960thanafter.Periodprovidesanexplanation,oratleastaweakproxyforanexplanation(Hobcraftetal.,1982),thatishistoricalinnatureandthatmayhelpidentifythosehistoricaleventsthataremostplausibleasexplanationsforagivenbehavior.Therearetwowaysinwhichtheanswertothequestion"inwhatyearwereyourborn?"maybeusedtoexplainbehavior.ThefirstiswhatwemaycallOrientalAstrologicalTheory:Individualsbornincertainyearshavecertaincharacteristicsbyvirtueofhavingbeenborninthatyear.Forexample,accordingtoOrientalastrology,womenbornintheyearofthefieryhorse(whichrecursevery60years)haveapropensitytomurdertheirhusbands.Formostsocialscientists,thisisaratherunsatisfactoryapproachtoexplaininghomicide;itdoes,however,haveanimpacteitheronactualfertilityoronthereported(butnotnecessarilytrue)birthdateofwomeninJapan,asdocumentedbythePopulationReferenceBureau(1989).Alternatively,theyearinwhichoneisbornexplainsone"sbehaviorintermsofhowoldonewas(development)inaparticularyearorduringparticularevents(history).Inotherwords,theeffectofbirthcohort,measuredasyearofbirth,mayserveasaproxyfortheinteractionoftheeffectsof34 华中科技大学硕士学位论文ageandperiod.CohortEffects:ReconceptualizationandReplacement.Oneapproachtocohorteffects,then,istoregardthemastheinteractionofageandperiodeffects.Analternativewouldbetoassumethatitisnotcohortmembershipitself,butrathersomecharacteristicorsetofcharacteristicsassociatedwiththebirthcohortthatproducedtheapparentcohorteffect.Theproblemthenbecomesoneofidentifyingtheappropriatecharacteristicorsetofcharacteristicsofthecohort,atheoreticalratherthanamethodologicalproblem.Onesolutiontothisproblemhaspotentiallybroadapplicability:Forcohort,measuredasyearofbirth,substitutethenumberofindividualsborninabirthcohort,orcohortsize.AccordingtoRyder(1965),"Acohort"ssizerelativetoitsneighborsisapersistentandcompellingfeatureofitslifetimeenvironment."Masonetal.(1973)notethatallthreevariables,age,period,andcohort,areproxiesforunmeasuredvariables,andtheyindicatethat"ifcohortsizeisthevariablewhichcausesdifferentiationinthecontextofaspecificsubstantiveproblem,then,ifsizemeasurementscanbeconstructed,itisunnecessarytoincludecohortsassuchinthespecificationbecausethepreferredvariableisavailable."Theyalsonotethatuseofcohortsizeeliminatestheestimabilityproblemforwhichtheirdummyvariableregressionmodelwasconstructed,andmakestheresultsoftheanalysislesstentative.Hobcraftetal.(191"2)andRodgers(1982a)raisesimilarpoints.Ryder(1965)notesthatsizeisonlyoneofseveralcharacteristicsthatmaybeusedtodifferentiatecohortsfromoneanother;however,cohortsizeisthecharacteristicthathasplayedthemostimportantroleinresearchsincethepublicationin1968ofEasterlin"sworkregardingtheimpactofcohortsizeonthelaborforce,andhissubsequentwork,publishedin1980,regardingtheimpactofcohortsizeonavarietyofsocialproblems,includingunemployment,divorce,andcrime(Easterlin,1987).Thepointofallthisisthatcohort,measuredasyearofbirth,hassometimesbeenusedwhencohortsizeorsomeothercohortcharacteristic(oranonlinearinteractionterminvolvingageandperiod)wouldhavebeenmoreconceptuallyortheoreticallyappropriate35 华中科技大学硕士学位论文forstudyingage,period,andcohorteffects.Thismaystematleastinpartfromafailuretorecognizethatage,period,andcohorthavequalitativelydifferentconceptualstatuses.Although,asnotedabove,cohortmembershipmaybetreatedasanexplanatoryvariablefromapurelymethodologicalviewpoint,itisnotgenerallyappropriate,theoreticallyandsubstantively,todoso.Ageandperiodaremoreappropriateasexplanatoryvariables,agemoresothanperiod(Hobcraftetal.,1982).Ideally,onewouldeliminateperiodandcohortandreplacethemwiththevariablesforwhichtheyactasproxicsinanycausalanalysis.Intheanalysisofdevelopmentalorhistoricalchange,theuseofmultiple-year,multiple-cohortdesigns,coupledwithappropriateoperationalizationofage,period,andcohorteffects(i.e.,theuseofcohortcharacteristicsorofanonlinearage-periodinteraction)wouldallowustotestwhetheragehadaneffectonpoliticalattitudes,netofperiodeffectsandcohortmembership.Somesolutionoftheproblemofconfoundingamongage,period,andcohorteffects,whethertheoretical(e.g.,useofcohortsizebasedontheworkofEsterlinandothers,orapriorieliminationofthepossibilityofacohorteffect)ormethodological(e.g.,useoftheMasonetal.dummyvariableregressiontechnique)needstobefoundbeforeageeffectscanbeinferredinanystudy.Intheexampleofpoliticalconservatism,itmaybetheoreticallyreasonabletoeliminatecohortmembershipasaninfluenceonpoliticalattitudes,ortoassume(ontheoreticalgrounds)thatanyeffectofcohortmembershipoperatesthroughcohortsize(orsomeothercohortcharacteristic).Oncethisisdone,itbecomespossibletoestimateseparateage(developmental)andperiod(historical)effectsonpoliticalattitudes.Notethatdevelopmental,historical,andcohortmembershipeffectscannotbeclearlyseparatedwithoutlongitudinaldata.PeriodEffects:ChangesOverTime.Onceonehasdealtwiththeissueofseparatingage,period,andcohorteffects,itbecomespossibletoexaminechangesastheyoccurovertime.Typically,thiswillmeaneitherignoringcohorteffectsorrepresentingthemintermsofcohortcharacteristicssuchascohortsize.Inaddition,ifweareconcernedonlywithchangesoverchronologicaltime(historicalchanges)andnotwithchangesoverage36 华中科技大学硕士学位论文(developmentalchanges),wemusteitherbecertainthatageisentirelyirrelevant,orincludeageasanexplanatoryvariable,orcontrolforagebymakingage-specificcomparisons.Oneconcernoflongitudinalresearchisthesimpledescriptionofchangesinvaluesorvariablesovertime.Attheindividuallevelofanalysis,thismayincludechangesinreligiousbeliefs,politicalconservatism,oruseofalcohol.Mostoftenitisnecessarytoconsiderthepossibilitythatchangeattheindividuallevelmayrepresentadevelopmentalratherthanahistoricaltrend.Atanaggregatelevel,wemayusechangesinratesofcrimeorvictimization,inworkerproductivityorinpercapitagrossnationalproduct,inScholasticAptitudeTest(SAT)scores,orininfantmortalityrates,associalindicatorsofprogressordeclineinmeetingbasicsocialneedsorachievingdesirablesocialgoals.Atthislevelitmaybepossibletocontrolfortheeffectsofage.Infantmortalityisalreadyage-specific(althoughtheageofthemothermayaffectthelikelihoodoftheinfant"sdeathbeforeageone),andtheSATistakenprimarilybyindividualsaged16-18.Ageisthuscontrolledcompletelyortoalargeextentforthesemeasures.Ratesofcrimeandvictimizationaresensitivetotheagedistributionofthepopulation(e.g.,ChiltonandSpielberger,1971;Skogan,1976),anditwouldbeappropriatetocontrolforagecompositioninevaluatingtheevidenceforhistoricaltrendsforthesevariables.Percapitagrossnationalproductmaybesensitivetotheage-dependencyratio(theratioofthoseunderage15plusthoseoverage65tothoseages16-64),anditisalsopossiblethatworkerproductivityissensitivetotheagedistributionofworkers,butifthesechangeslowlyorremainfairlyconstantovertheperiodsforwhichthedataarecollected,itmaybepossibletoignorechangesinageoragedistributionassourcesofvariationinperiodtrends.Oneofthesafestwaystoapproachthestudyoftrendsovertimeistouseage-specificcomparisons.Inanage-specificcomparison,onlythosecasesofacertainageinoneyeararecomparedwithcasesofthesameageinsomesubsequentyear.Theagemayrepresent37 华中科技大学硕士学位论文asingleyear(e.g.,age15)orarangeofyears(e.g.,overage65),andseparatecomparisonsmaybemadeforallpossibleagesoragegroups.Forexample,Goldandhisassociates(GoldandReimer,1975;WilliamsandGold,1972)examinedratesofself-reporteddelinquencyamongnationalprobabilitysamplesof13-to16-year-oldsinarepeatedcross-sectionaldesign,andfoundlittleevidenceofchangefrom1967to1972.Menard(1987a)obtainedsimilarresultsfornationalprobabilitysamplesof15-to17-year-oldsfrom1976to1980.Hisdataweretakenfromaprospectivepanelstudy,andinordertoseparateageandperiodeffects,heusedonly15-to17-year-olds(theonlyagesforwhichdatawereavailableinallfiveyears)ineachyear.CoveyandMenard(1987,1988)examinedtrendsinvictimizationandtrendsinarrestsforthoseoverage65andfoundthatratesofarrestsweregenerallyincreasingandratesofvictimizationweregenerallydecreasingamongthisolderagegroup.Ineachoftheabove-citedstudies,controllingforageproducedrelativelyunambiguousevidencefortheexistenceorabsenceoftrendsovertime.Withoutsuchcontrolsforage,itmaybedifficulttoascertainwhetherchangesarehistoricalordevelopmentalinnature,eveniftheentirepopulationisusedinsteadofasample.ChiltonandSpielberger(1971)examinedchangesinofficialcrimeratesandfoundthatmuchoftheapparentchangeovertime(whatappearedonthesurfacetobeachangeinbehavior)wasattributabletochangesintheagestructure,ormorespecifically,tochangesinthepercentageofthepopulationintheadolescentages.Individualstudieswillvary,butingeneralitisappropriatetoconsiderthepossibilitythatapparentperiodtrendsmayactuallybeattributabletochangesinage(altheindividuallevel)oragecomposition(attheaggregatelevel).TemporalTrendsinRelationshipsBetweenVariables.Anotherconcernoflongitudinalresearchistheexaminationofchanges,notinvaluesorlevelsofvariablesovertime,butinrelationshipsbetweenoramongvariablesovertime.Itisonething,forexample,tosaythatmortalityhasbeendecliningformorethantwocenturies.Itisanothertoindicatethatintheearlystagesofmortalitydecline,reductionsinmortalitywereachievedprimarilyby38 华中科技大学硕士学位论文publichealthmeasures(sanitation,accesstosafedrinkingwater,pasteurization,andsoforth)andmedicineplayedlittleifanyrole,butinthelaterstagesofthedecline,advancesinmedicine(inoculation,antibiotics)ratherthanpublichealthmeasureswereresponsibleformortalitydeclines(McKeown,1976;McKeownandRecord,1962;McNeill,1976).Inthecontextofexaminingchangesinthestrengthorpatternsofrelationshipsovertime,oneimportantconcernisthereplicationofpreviousresultswithnewdata.Elliottetal.(1989)useddatafromsuccessiveyearstotestatheoreticalmodelofdelinquentbehavioronasetofdependentvariablesthatincludeddelinquency,druguse,andmentalhealthproblems.Intheinitialtest,theresultsindicatedthatthemodeldidagoodjobofexplainingdelinquencyanddruguse,butapoorerjobofexplainingmentalhealthproblems.Usingdatafromthesamesubjects,measuredoneyearlater.Elliottetal.successfullyreplicatedtheresultsofthefirsttest.Theabilitytoreplicateresultsfromoneperiodtothenext(ineffect,anindicatorofreliabilityofresults)providesmoresupportforthemodelthanwouldasingletest,withoutreplication.Replicationisnotalwayssuccessful,andevidenceofchangesinstrengthorpatternsofrelationshipsovertimemayalerttheresearchertorealchangesortomethodologicalproblemssuchasinstabilityorunreliabilityofmeasurement,ormisspecificationofacausalmodel.Menard(1987b)testedamodeloffertilityon85lessdevelopedcountriesfortheperiods1970and1980.Theoverallpatternsforthetwoperiodswereverysimilar,butrelationshipsinvolvingfamilyplanningprogrameffortchangedfrom1970to1980,usuallyinthedirectionofweakerrelationships.Otherthanthischange,themodelforthetwoperiodsproducedalmostidenticalresults,AsindicatedbyMenard,thesechangesmayhavereflectedchangesinthemeasurementoffamilyplanningprogrameffort,butthestrongrelationship(Pearson"sr=.83)betweenfamilyplanningprogrameffortasmeasuredinthetwoperiodsseemedmoresuggestiveofarealchangeinthestrengthoftherelationshipthanofunreliabilityinmeasurement.Neitherthepossibilityofinstabilityorunreliabilityofmeasurementnortheoverallconsistencyofthemodelfromoneperiodto39 华中科技大学硕士学位论文anothercouldhavebeendocumentedwithoutreplication.Ageeffects:LifeCycleandDevelopmentalChanges.BaltesandNessclmade(1979)listedfiveobjectivesorrationalesforlongitudinal(ormorespecifically,intheircase,prospectivepanel)research:(1)directidentificationofintraindividualchange,i.e.,whetherindividualschangefromoneperiodtoanother;(2)directidentificationofinterindividualsimilaritiesordifferencesinintraindividualchange,i.e.,whetherindividualschangeinthesameordifferentways;(3)analysisofinterrelationshipsinbehavioralchange,i.e.,whethercertainchangesarecorrelatedwitheachother;(4)analysisofcausesordeterminantsofintraindividualchange,i.e.,whyindividualschangefromoneperiodtoanother;and(5)analysisofcausesordeterminantsofinterindividualsimilaritiesordifferencesinintraindividualchange,i.e.,whydifferentindividualschangeindifferentwaysfromoneperiodtoanother.Alloftheseobjectivesareconcernedwithpatternsofdevelopmentalchange,specificallyattheindividuallevel,althoughtheyareeasilyextendedtoaggregatelevels(groups,organizations,cities,nations).Attheindividuallevel,intraindividualchangesmayincludethingspeoplethink(becomingmorepoliticallyconservative),thingstheydo(becomingemployed,changingjobs,retiring),orthingsthataredonetothem(beingarrestedorbeingrobbed).Inthestudyofintraindividualchange,ageservesasaproxyforphysiologicalchangesandexposuretosocialinfluences(Hobcraftetal.,1982)thatmaybedifficultorcostlytomeasuredirectly.Forsomepurposesitmaybereasonabletodrawsimpleinferencesaboutintraindividualchangefromcross-sectionaldata.Forexample,fromcross-sectionaldataonratesofarrestandchildbearingbyage,wemayreasonablyinferthatone"slikelihoodofbeingarrestedorofhavingababyispracticallynonexistentbeforeage7,increasesinadolescenceandearlyadulthood,anddiminishessubstantiallyafterage65.Therewouldseemtobelittlechancethattheseage-relateddifferencesmaybeexplainedbyperiodeffectsorcohortcharacteristics.Ontheotherhand,itwouldnotbesafetoinferthatpeoplebecomemoreconservativeandlesseducatedastheygetolder,basedon40 华中科技大学硕士学位论文cross-sectionaldata.Asnotedearlier,agedifferencesinpoliticalattitudesataparticularperiodmayreflecteitherchangesinattitudeswithage,orconstancyinattitudesoverthelifecyclecoupledwithdifferencesinattitudesbetweencohorts.Ifolderpeoplehavelesseducationthanyoungerpeople,itisnotbecausetheybecome"de-educated";amoreplausibleexplanationisthateducationalattainmenthasincreasedovertime(aperiodeffect),resultingindifferencesintheaverageeducationallevelofsuccessivecohorts.Theuseofcross-sectionaldatatostudytherelationshipbetweenageandbehavioramountstotheconstructionofasyntheticcohort,apracticecommoninthedemographicstudyofmortalityandfertility.Lifeexpectancyandperiodtotalfertilityrates,forexample,arebasedontheuseofcross-sectionalmortalityandfertilityrates,butareextrapolatedbyinsurancecompanies(inthecaseoflifeexpectancy)andotherstodescribewhatmayhappentoanindividualoracohortofindividualsastheygrowolder.AsShryockandSiegel(1934:324)caution,theutilityofsyntheticcohortmeasuresdependsontheextenttowhichtheyreflecttheactualexperienceofrealcohorts(somethingthatcanbeevaluatedonlywithlongitudinalresearchoncohorts).Insomecases,cross-sectionalandlongitudinaldatamayleadtoverydifferentconclusionsaboutdevelopmentalpatterns.Forexample,Greenberg(1985)usingofficiallyreportedcrime,andMenardandElliott(1990a),usingself-reporteddelinquency,bothfoundthatcross-sectionalandlongitudinaldatamayproducedifferentconclusionsaboutthepreciserelationshipbetweenageandillegalbehavior.Inpart,thedifferencesbetweenthelongitudinalandcross-sectionalresultsmaybeattributabletocohortsizeeffect(Elliottetal.,1989:107-109;MenardandElliott,1990b).Amorecompellingneedforlongitudinaldataarisesifwewishtostudy"career"patternsofbehavior.Themostobviousapplicationofthisisinthestudyoflabormarketcareers,frominitialjobentrythroughpatternsofpromotion,jobchange,jobloss,andeventuallyeitherretirementordeath.Closelyrelatedtothisisthestudyofstatusattainmentcareers,whichincludesconsiderationofeducationalattainmentaswellas41 华中科技大学硕士学位论文occupationalstatusandincome(e.g.,BlauandDuncan,1966).Otherapplicationsofthe"career"perspectiveincludemaritalhistories(e.g.,Beckeretal.,1977),educationalattainmentandtheprocessoflearning(e.g.,Heyns,1978),andcriminalCareers(e,g.,Blumsteinetal.,1986).Suchstudieshaveincommonaconcernwithpatternsofentry,continuity,andexitfromthebehavioruponwhichthecareerisbased,andwiththecorrelatesandpotentialcausesassociatedwithchangesordiscontinuitiesinthebehavior(unemploymentandobtaininganewjob;divorceandremarriage;dropoutandreentryineducation;suspensionandresumptionofcriminalbehavior).Itisonlywithlongitudinaldata,andmorespecificallypaneldata,thatmanyofthequestionsregardingdevelopmentalcareerpatternsmaybeanswered.Longitudinaldataarealsoimportantinexperimentalresearchandevaluationresearch.Mostexperimentaldesignsandquasi-experimentaldesignsareinherentlylongitudinal,withmeasurementoccurringbothbefore(pretest)andafter(posttest)theexperimentaltreatmentorinterventionisadministered(CampbellandStanley,1963),inordertoascertainwhetherdifferencesattheposttestareattributabletothetreatmentortopreexistingdifferencesbetweentreatmentandcontrolgroups.Inexperimentaldesigns,evenwhenapretestisnotused,theresearcherassumesthattherandomizationortheassignmentofsubjectstodifferenttreatmentsproducesgroupsthateitherdonotdifferonanyimportantvariable,orwhosedeviationsfromaresubjecttoknownstatisticaldistributions.Evenaposttest-onlyexperimentaldesignthusincludesacriticallongitudinalassumption,namelythatadifferencebetweentheexperimentalandcontrolgroupsattheposttestrepresentsachangefromthepretest,atwhichitisassumed,withoutpossibilityofproofordisproof,thatthereislittleornodifferencebetweentheexperimentalandthecontrolgroups.Similarly,pretestorbaselinedataareoftencollectedinevaluationresearch(RossiandFreeman,1989).Theabsenceofpretestorbaselinedatahastheeffectofrenderinguncertainwhetherdifferencesaftersometreatmentorinterventionmaybewhollyattributabletothetreatmentorintervention,ortopreexistingdifferencesbetween42 华中科技大学硕士学位论文thegroupthatdidandthegroupthatdidnotreceivethetreatmentorintervention.DevelopmentalTrendsinRelationshipsAmongVariables.Paralleltotheearlierconcernwithexaminingchangesinthestrengthorpatternofrelationshipsfromoneperiodtoanother,wemaywanttoexaminechangesinthestrengthorpatternofrelationshipsfromoneagetoanother.Hereagaintheissueofwhethertobasethecomparisononcross-sectional(intercohort)orlongitudinal(intracohort)datamayarise,andasbeforethedecisionhingesonwhetherweareconcernedwithhowwellthedevelopmentalchangesarereflectedinthecross-sectionaldata.Iflongitudinaldataareused,theissueofwhetheranychangethatoccursisattributabletoage,period,orcohorteffectsmustagainbeconsidered.Inastudyof341adolescentboysinNewJersey,LaGrangeandWhite(1985)foundthatforolder(age18)andyounger(age12)adolescentboys,onlyonevariable,theextentofassociationwithdelinquentfriends,hadasubstantialeffectondelinquentbehavior.For15-year-oldboys,however,familyandschoolvariablesalsoaffecteddelinquentbehavior,sometimesmorethanassociationwithdelinquentfriends.Althoughtheirsamplesizewassmall,andtheage-specificsubsampleswereevensmaller(81to138casesforthethreeseparateagegroups),theirstudyraisestheimportantpointthattheresultsofmultivariatecausalanalysismayvary,atleastwithregardtothestrengthofrelationships,dependingontheageoftherespondentsinthesample.Becausetheirdataarecross-sectional(differentagegroupsmeasuredinthesameyear),itisnotpossibletoruleoutanotherpotentialexplanation:Thedifferencesmaynotbeagespecific,butmaybecohortspecificinstead.Fullresolutionofthisissuewouldrequireareplication,preferablywithlongitudinaldata.UsingdatafromtheNationalYouthSurvey,aprospectivelongitudinalpanelsurveyofrespondentsaged11-17in1976and21-27in1986,Menardetal.(1989)foundthatmarriageduringadolescencewaspositivelyassociatedwithsubstanceuseandmentalhealthproblems,butthatmarriageduringyoung,adulthood(ages21-27)wasnegativelyassociatedwithsubstanceuseandmentalhealthproblems.Beingenrolledinschoolhada43 华中科技大学硕士学位论文negativeassociationwithillegalbehavior,substanceuse,andmentalhealthproblemsinadolescence,butnoassociationwithillegalbehavior,substanceuse,ormentalhealthproblemsforyoungadults.Wofford(1989),analyzingthesamesample,foundthatemploymentwasassociatedwithhigherratesofseriousillegalbehaviorinadolescenceandlowerratesofseriousillegalbehaviorinyoungadulthood(ages18-24inthisstudy).Substantively,theseresultsrequireexplanation.Itmaybethatthereexistage-specificnormsforcertainbehaviors(school,marriage,work),andthatviolatingthosenormsplacesoneatgreaterriskofinvolvementinillegalorproblembehavior.Methodologically,theseresultssuggestthatrelationshipsamongvariablesmaychangeoverthecourseofthelifecycle,andthatitmaybeappropriatetotestfortheexistenceofsuchchanges.Withcross-sectionaldata,suchdifferencesmaybeattributedtoageortointercohortdifferences;withlongitudinaldataonmultiplecohorts,itbecomespossibletoestimatetheextenttowhichthedifferencesaredevelopmental,asopposedtoperiodorintercohortdifferences.CausalRelationshipInordertoestablishtheexistenceofacausalrelationshipbetweenanypairofvariables,threecriteriaareessential(Asher,1976;BaltesandNesselroade,1979:35;Blalock,1964;Williamsonetal.,1982:218-219):(1)thephenomenaorvariablesinquestionmustcovary,asindicatedforexamplebydifferencesbetweenexperimentalandcontrolgroupsorbyanonzerocorrelationbetweenthetwovariables;(2)therelationshipmustnotbeattributabletoanyothervariableorsetofvariables,i.e.,itmustnotbespurious,butmustpersistevenwhenothervariablesarecontrolled,asindicatedforexamplebysuccessfulrandomizationinanexperimentaldesign(nodifferencesbetweenexperimentalandcontrolgroupspriortotreatment)orbyanonzeropartialcorrelationbetweentwovariableswithothervariablesheldconstant;and(3)thesupposedcausemustprecedeorbesimultaneouswiththesupposedeffectintime,asindicatedbythechangeinthecauseoccurringnolaterthantheassociatedchangeintheeffect.Evidenceforthefirsttwocriteriamaybeobtainedfrompurelycross-sectionalortime-orderedcross-sectional44 华中科技大学硕士学位论文data.Thethirdcriterioncanusuallybetestedadequatelyonlywithlongitudinaldata.Oneexceptionisifbiologicalorgeneticcharacteristics(sex,race)areamongthevariablesthoughttoproduceaneffect.Withsuchvariables,wemaysafelyassumetemporalorderwithoutlongitudinaldatabecause,ineffect,wheneverafixedorheritabletraitissuggestedasacauseofavariablecharacteristic(politicalattitudes,illegalbehavior),wehavedatathatareatleastpartiallytimeordered;weknowthatthefixedtraitmusthaveoccurredfirst.Putanotherway,themeasurementoffixedbiologicalorgeneticcharacteristicsmaybemadeataparticularperiod,butitisforallperiods,beginningatbirth.Thesituationbecomesmorecomplexifthereisapossibilityofanonrecursivecausalrelationship.Insometheories,causalinfluencesflownotonlyfromXtoY,butfromYtoXaswell.Forexample,Malthus(Appleman,1976)hypothesizedthat(a)increasedfoodsupplypercapitaleadstoincreasedfertility,and(b)increasedfertilityleadstodecreasedfoodsupplypercapita.Withonlycross-sectionaldata,issuesofcausalorderordirectionregardingbivariaterelationshipscannotberesolvedwithoutagreementaprioriontheeliminationofcausalrelationshipsincertaindirections(Blalock,1962;Heise,1975;Simon,1954).Wherethereisanonrecursivecausalpatterninvolvinganegativefeedbackloop,assuggestedinMalthusiantheory(above),itbecomesextremelydifficulttoadequatelymodeltheprocesswithonlycross-sectionaldata,evenusingtwo-orthree-stageleast-squaresorotherfairlysophisticatedmethodsofdataanalysis.Withlongitudinalpaneldata(repeatedcross-sectionaldatamaynotbeadequatehere)itbecomesmorelikelythattheissuesofcausalordercanberesolved,andthattestsforcausalinfluencesinbothdirectionscanbemade.(Itismoreprobable,butnotlogicallyguaranteed,thatlongitudinaldatawillpermitreliableestimatesofreciprocaleffects;forexample,measurementperiodsmaynotbepreciseenoughtoseparatetheoccurrenceofchangesinonevariablefromtheoccurrenceofchangesinanother,andthustoresolvetheissueofindeterminateordering.)IntheexampleofMalthusiantheory,withitsnegativefeedbackloop,fairlylong45 华中科技大学硕士学位论文time-seriesdatamayberequiredforanadequatetestofthetheory.Oneapproachtoidentifyingcausaldirectionthatallowsfortheidentificationofreciprocalcausalinfluencesislinearpanelanalysis,discussedextensivelybyKesslerandGreenberg(1981).Menard(1990)usedlinearpanelanalysistotestforreciprocaleffectsinthecontextofcompetingtheoriesoftherelationshipsamongfertility,mortality,familyplanningprogrameffort,andeconomicdevelopment.Aseriesofmodelswerecalculatedwitheachvariableinturnconsideredasadependentvariable,andallvariables,measuredatalimepriortothemeasurementofthedependentvariable(includingalaggedendogenousvariable,i.e.,thedependentvariablemeasuredataprevioustime)areincludedaspredictorsofthedependentvariable.Withinthisframework,thepossibilitythateachvariablehassomeeffectoneachothervariablemaybeexaminedinawaythatisimpossiblewithcross-sectionaldata.Theinclusionofalaggedendogenousvariableintheequationhelpscontrolforeffectsofunmeasuredvariablesandprovidesarelativelyconservativetestfortheexistenceofa(nonzero)causalrelationship.Menardfoundevidenceforreciprocalcausalrelationshipsnotincludedinpreviouscross-sectionalmodelsoffertility,andalsofoundevidencethatthesupposedcausalorderusedinpreviousstudiesmayhavebeenincorrect(i.e.,themodelsmayhavebeenmisspecified).Suchfindingsareparticularlyusefulbecausetheydealwithrelationshipsamongvariablesthattendtochangecontinuouslyandforwhichascertainingtruetemporalordermaybedifficult(e.g.,anationdoesnot"initiate"fertilityoreconomicdevelopmentatsomeidentifiabletime;bothoccurcontinuouslythroughouttheexistenceofthenation,andonecannotsaythatone"started"beforetheother).Notethatthereciprocaleffectsidentifiedinthistypeofanalysisarenotinstantaneous,butlaggedovertime.Eachofthemodels(estimatedforeachdependentvariable)istechnicallyrecursive,becausethereareno"instantaneous"reciprocaleffects;itisonlybycombiningtheresultsofthemodelsforeachoftheseparatedependentvariablesthatwecaninfertheexistenceofbidirectionalornonrecursivecausalinfluences.46 华中科技大学硕士学位论文TrueTemporalOrderandCausalRelationships.Insomecases,itmaybepossibletoidentifyadistinct"start"fortwovariables,andtoascertainthetruetemporalorderbetweenthetwo.Insuchcases,onecannotnecessarilyinferthatthefirstvariabletochangecausesthesecond(thecriteriaofcovariationandnonspuriousnessmuststillbemet),butsuchatestwouldprovideevidencethatthesecondvariabletochangedidnotcausethefirst.Elliottetal.(1989)andHuizingaetal.(1989)examinedtherelationshipbetweenillegalbehavioranddruguse,andconcludedthatifonecausestheother,itismorelikelythatillegalbehaviorleadstodrugusethanthatdruguseleadstoillegalbehavior.Allrespondentswhoeverbecameinvolvedinbothillegalbehavior(excludingalcohol,marijuana,andharddruguse)andalcoholusebecameinvolvedinillegalbehaviorfirst;allofthosewhoeverbecameinvolvedinbothillegalbehaviorandmarijuanausebecameinvolvedinillegalbehaviorfirst;andallofthosewhoeverbecameinvolvedinbothillegalbehaviorandharddrugusebecameinvolvedinillegalbehaviorfirst.Ifacausemustprecedeaneffectintime,thentheonsetofalcoholanddrugusearelargelyruledoutascausesoftheonsetofillegalbehavior.Themostplausibleconclusionswouldbeeitherthatillegalbehaviorcausesalcoholanddruguse,orthatillegalbehavioranddrugusehavecommoncauses(i.e.,therelationshipisspurious),andillegalbehaviortendstooccurbeforealcoholordruguseasaresultofthesecauses.BasedonevidenceinElliottetal(1985,1989),thelatterexplanation(spuriousrelationship)appearsmorelikely.Inarelatedstudy,MenardandElliott(1990a)testedtwotheories:Onesuggestedthatinvolvementwithdelinquentfriendsleadstodelinquentbehavior,andtheothersuggestedthatdelinquentbehaviorleadstoinvolvementwithdelinquentfriends.Theyfoundthatassociationwithdelinquentfriendstypicallyprecededarespondent"sowninvolvementindelinquentbehavior,thusindicatingsupportforthefirsttheory(learningtheory)andevidenceagainstthesecond(controltheory).Again,theestablishmentoftemporalorderisnotinitselfsufficienttoestablishcausality,butitdoesprovideevidenceoftheplausibilityofonecausalrelationshipasopposedtoanother.47 华中科技大学硕士学位论文OtherIssuesinCausalAnalysis.Inadditiontoaddressingissuesofcausalorderandtheexistenceofreciprocaleffects,longitudinaldataandanalysisinconjunctionwithcausalmodelingmaybeusedtoexaminethedistinctionbetweenlong-andshort-termeffectsonbehavior.McCord(1983)foundlong-termconsequencesonadultaggressionandantisocialbehaviorofchildhoodaggressiveness,parentalaggressiveness,parentalcontrol,andparentalaffection.StudiesofthePerryPreschoolProject(Berrueta-Clementetal,1984;SchweinhartandWeikart,1980;Weikartetal,1978),aHeadStart-typepreschoolprogram,foundshort-termeffectsonstudentbehaviorandlearningthatseemedtodissipateinlateryears,thenreemergeaslong-termeffectsasthestudentsenteredadolescence.Withmethodssuchaseventhistoryanalysis(Allison,1984),itbecomeseasier,givenappropriatedata,todirectlycombinetheanalysisofageandperiodeffectswithcausalanalysistoexplaindevelopmentalandhistoricalchange.Theseexamplesfallunderthebroaderheadingsofdescribingchangeandofcausalanalysis,yettheyindicatethatquestionsaboutchangeandcausalitymaysometimesbemorecomplex(Iong-vs,short-termchange;causalinfluencesonratesofchange)thansimplequestionsofwhetherandwhychangesoccur.Thetypeofquestionthatisaskedmayhaveimportantimplicationsforwhichofseveralpossiblelongitudinaldesignsismostappropriateforaparticularstudy.SerendipityandIntentionalityinLongitudinalDataTheearliestlongitudinaldatainthesocialsciences,nationalcensusdata,wereprobablynotoriginallycollectedforthepurposesofmeasuringchangeorofestablishingthedirectionormagnitudeofcausalrelationships.Moretypically,thetwopurposesofearlycensuseswereconscriptionandtaxation(Thomlinson,1976).Later,intheUnitedStates,politicalapportionmentwastheonlyconstitutionallymandatedpurposeofthecensus,andinmorerecentyearsthecensushasalsobeenusedasabasisforallocatingfundsfromthefederalgovernmenttothestates.Thefactthatcensusdatamaybeusedtomeasurechangeandperhapstoinferthenatureofcausalrelationshipshasbeen,atleast48 华中科技大学硕士学位论文untilrecently,moreserendipitousthanintentional.Thesamemaybesaidaboutmanyothersourcesoflongitudinaldataaswell.Inthetwentiethcentury,andespeciallysinceWorldWarII,thecollectionoflongitudinaldatafortheanalysisofchangeandcausalityhasbecomemoreconsciousanddeliberate,associalscienceresearchgenerally,andlongitudinalresearchinparticular,havecometobemorehighlyvaluedbygovernmentsandbythescientificcommunity.Still,itremainsthecasethatlongitudinalresearchisasecondary,notprimary,reasonforthecollectionofmuchperiodicdatabygovernmentagencies.Asaresult,methodsofcollectingdataordefinitionsofvariablesmaychangeinwaysthatrenderdatalessthanfullycomparablefromoneperiodtoanother.Indemography,forexample,theUnitedNationshasattemptedtosetstandardsforthecountingofinfantdeathsandthecalculationofinfantmortalityrates.Asidefromproblemsofcrossnationalstandardization,theadoptionofthosestandardsbycountriessuchasSwedenin1960andSpainin1975(Hartford,1984)produceddiscontinuitiesinthedatasothatcomparisonsofinfantmortalityratesovercertaintimeperiods,e.g.from1970to1980inSpain,areimpreciseandproblematic.Completenessofregistrationorcountingofeventsmayalsovaryovertime,againmakingevencrudemeasurementsofchangeproblematic.ThePresident"sCommissiononLawEnforcementandtheAdministrationofJustice(1967)cautionedthatproblemsincoverageofruralareasintheUnitedStatesrenderedthecrimestatisticsreportedbytheFederalBureauofInvestigation(annual)priorto1958"neitherfullycompatiblewithnornearlysoreliable"asdatareportedforsubsequentyears.Issuessuchasthesemaybemoreadequatelyaddressedwhendataarecollectedprimarilyforlongitudinalresearchtobeginwith,butitisworthcautioningthatdatathatareinitiallycollectedforotherpurposes,andtowhichresearchersserendipitouslyhaveaccess,shouldbecarefullyscrutinizedtodeterminetheirsuitabilityforthepurposesoflongitudinalresearch.Changesinhowunitsoreventsaredefinedandcounted,orintheextenttowhichtheintendeduniverseofcasesisadequatelysampled,mayrendersomedatasetsunsuitableforuseinlongitudinalresearch.49 华中科技大学硕士学位论文3.DESIGNSFORLONGITUDINALDATACOLLECTIONNot-Quite-LongitudinalDesignsInChapter1,longitudinalresearchwascontrastedwithpurecross-sectionalresearch,inwhichdataarecollectedonlyonce,contemporaneously,foreachvariableforeachcase.Prospectivepanel,retrospectivepanel,andrepeatedcross-sectionaldesignsweredescribed.Somestudiesdonotfallneatlyunderthedefinitionoflongitudinalresearchorofpurecross-sectionalresearch.Ahluwalia(1974,1976)useddataonpercapitagrossnationalproductandincomeinequalitytoexaminetherelationshipbetweenincomeinequalityandeconomicdevelopment.Becausedataonincomeinequalityarecollectedsporadically,Ahluwaliauseddatainwhich,foreachcase,incomeinequalityandpercapitagrossnationalproductweremeasuredatthesametime,butfordifferentcountries(cases)measurementoccurredindifferentyears(e.g.,foronecountrythetwovariableswouldbemeasuredfortheyear1955,andforanothercountrythetwovariableswouldbemeasuredfortheyear1972).Byperformingasingle,cross-sectionalanalysisondatacollectedoveran18-yearspan(1965-1972),Ahluwalia"sanalysisimplicitlyassumedthatthe18yearsconstitutedasingleperiod.Equivalently,thisapproachassumedthatthedataonbothpercapitagrossnationalproductandincomeinequalitywerestable(nomajorchangesinvalues,oratleastintheranking,ofcountriesonthesevariables),oratleastthattherelationshipbetweenthesevariablesremainedlargelyunchangedoverthis18-yeartimespan.Suchanassumptionshouldbemadeonlyaftercarefulconsideration,andpreferablywithempiricalsupportaswell.Contrarytotheassumptionofstability,Menard(1983,1986)presentedevidenceofinstabilityinincomeinequalityovertime,tothepointthatfortheperiodincludedinAhluwalia"sdata,therankingofcountrieswithrespecttoincomeinequalitychanged.Atthesametime,percapitagrossnationalproductremainedstable.Ineffect,Ahluwalia"sdatamayrepresentaseriesofcross-sectionsinwhichthesamevariablesaremeasuredrepeatedly,butthecasesareneithercomparablenoridenticalfromoneperiodtothenext.Theperiodusedissolongthatthereisreasontodoubtthat50 华中科技大学硕士学位论文themeasurementsforallofthecasescouldproperlybeconsideredcontemporaneous.Inasomewhatdifferentvein,TolnayandChristenson(1984)deliberatelyselectedvariablesthatweremeasuredatdifferenttimesforuseinacausalpathanalysisoffertility,familyplanning,anddevelopment.Eachvariablewasmeasuredatthesametimeforallcountries,butdifferentvariablesweremeasuredatdifferenttimes,inordertomatchthetemporalorderofmeasurementwithcausalorderinthepathmodel.ThisisjusttheoppositeofthepatterninAhluwalia"sdata.ForAhluwalia,variablesaremeasuredatthesametimeforeachcase,butcasesaremeasuredatdifferenttimes;forTolnayandChristenson,casesaremeasuredatthesametimeforeachvariable,butvariablesaremeasuredatdifferenttimes.Althoughmeasurementoccursatdifferenttimesfordifferentvariables,eachvariableismeasuredonlyonceforeachcase,andthedatacannotbeusedtoperformeventhesimplesttruelongitudinalanalysis(e.g.,measuringchangeinavariablefromoneperiodtoanother).TheanalysisusedbyTolnayandChristensonisessentiallycross-sectionalinnature.Hadtheychosentopostulateinstantaneouseffects,theanalysiscouldhavebeenperformedjustaswellwithpurelycross-sectionaldata.Forthepurposesoftheiranalysis(evaluatingdirectandindirecteffectsoffamilyplanningeffortanddevelopmentonfertility),thisdesignisappropriate,andmayhaveanadvantageovermodelsinwhichcausalorderinthepathmodelandtemporalorderofmeasurementarenotthesame(MenardandElliott,1990a).ThedesignusedbyTolnayandChristenson,withtime-ordereddataandcross-sectionalanalysis,maybedescribedasatime-orderedcross-sectionaldesign.Althoughitisnottrulyalongitudinaldesignbythedefinitionpresentedearlier,itmayhavesomeadvantagesoverapurecross-sectionaldesignforpurposesofcausalanalysis.Theuseoftime-orderedcross-sectionaldata,asinTolnayandChristenson(1984),isdesirableoncetemporalorderhasbeenestablished,butitisinsufficienttoensurethatonedoesnot"predict"acausefromitseffect.Suppose,forexample,thatthetruecausalrelationshipbetweentwovariables,XandY.istherelationshipdiagrammedinFigure3.1.51 华中科技大学硕士学位论文PriorvaluesofXinfluencesubsequentvaluesofX;priorvaluesofYinfluencesubsequentvaluesofY.andpriorvaluesofYinfluencesubsequentvaluesofX-thatis,YisacauseoftheeffectXwithsomefinitetimelag.Suppose,however,thatwemistakenlybelieveXtobeacauseofYandinatime-orderedcross-sectionaldesign,weincludeX2asacauseofY3,excludingallotherX(X1andX3)andY(Y1andY2).Despitethefactthatwehavethewrongcausalorder,wewillprobablydiscoverarelationshipbetweenX2andY3,ifonlybecauseX2isdirectlyaffectedbyY1andY3isindirectly(viaY2)influencedbyY1.Ifthevariableschangerelativelyslowlyovertime(i.e.,iftheyarerelativelystable),thensimilarcorrelationswillbeobtainedwhetherwecompareX2andY3,X3andY2,orsomepurelycross-sectionalcombination(e.g.,X2andY2)ofthetwovariables.Withatruelongitudinaldesign(e.g.,aprospectivepaneldesign)andanalysis,itmightbepossibletoascertainthetruecausalFigure3.1.HypotheticalCausalRelationshipbetweenXandY.directionintherelationshipbetweenXandY.Two-wavelinearpanelanalysiswithlaggedendogenousvariablesshould,inprinciple,beabletodetectthefactthatYinfluencesXbutXdoesnotinfluenceY(e.g.,Menard,1990).Withcross-sectionaldata,eventime-orderedcross-sectionaldata,onerunstheriskofundetectablemisspecificationbecauseofincorrectcausalorderinginthemodelbeingestimated.Withlongitudinaldata,incorrectcausalorderingismorelikelytobedetected,e.g.,bytemporalorderanalysisorpanelanalysis,andthemodelmaybecorrected.TotalPopulationDesignsFigure3.2representsfourtypesoflongitudinaldesigns.InFigure3.2,thehorizontaldimensionrepresentstheperiod(amonth,year,ordecade)forwhichdataarecollected,andtheverticaldimensionrepresentsthecases(populationorsample)forwhichdataarecollected.Inatotalpopulationdesign,thetotalpopulationissurveyedormeasuredineachperiodofthestudy.Becausesomeindividualsdieandothersarebornfromoneperiodtothenext,thecasesarenotidenticalfromoneperiodtothenext,butiftheperiodsareshort,52 华中科技大学硕士学位论文theoverwhelmingmajorityofcasesmaybethesamefromoneperiodtothenext.Asoneexample,thedecennialcensusoftheUnitedStatesattemptstocollectdataonage,sex,ethnicity,andresidenceofthetotalpopulationoftheUnitedStatesevery10years,anddoessowithanaccuracyestimatedat95-99%(Robey,1989).Withsomewhatlower,butstillsubstantialaccuracyandcompletenessofcoverage,theFederalBureauofInvestigation"sUniformCrimeReportsattempttocollectdataonarrestsforspecificoffensesand,foralimitedsetofoffenses,crimesknowntothepolice,andtheage,sex,race,andresidence(urban,suburban,orrural)ofarresteesforallpolicejurisdictionsintheUnitedStates.Figure3.2.LongitudinalDesignsforDataCollection.Aswithanydata-collectioneffort,thetotalpopulationdesignmayhaveproblemsofmissingcasesormeasurementerror.Becausethetotalpopulationisincluded,thedesignshouldbeappropriateformeasuringorinferringperiodtrends,butcloseexaminationofageandcohorteffects(asdiscussedearlier)maybenecessarytoclarifythenatureofthosetrends.Forexample,apparentchangesinthenumberorrateofarrestsmayreflectchangesinpopulationcomposition(percentinthearrest-proneadolescentages)ratherthanchangesinindividualorgroupbehavior(ChiitonandSpielberger,1971).Separationofage,period,andcohorteffectsisthusasmuchanissueforthetotalpopulationdesignasforanyotherdesign,butthedesignposesnospecialproblemsinthisregard.Developmentalchangesmaybeexaminedbothcross-sectionally(withinagivenyear,acrosscohorts)andlongitudinally(withinagivencohortacrossyears,ifthereareenoughperiodstoexaminethedevelopmentalchangeinquestion),andtheresultsofthetwoapproachesforevaluatingdevelopmentaleffectsmaybecompared.Withproperselectionofappropriateperiods,cohorts,orothersubpopulations,anytypeoflongitudinalanalysismaybeperformedondatacollectedinatotalpopulationdesign,againwiththequalificationthatthereareenoughseparateperiodstopermituseofaparticularmethod.Forexample,linearpanelanalysistypicallyrequiresonlytwoorthreeperiods(KesslerandGreenberg,1981),53 华中科技大学硕士学位论文butARIMAtime-seriesmodelsideallyinvolveaminimumof50observationsin50distinctperiods(BoxandJenkins,1970:18;McClearyandHay,1980:20).EachoftheotherthreelongitudinaldesignsinFigure3.2involvesasampledrawnfromthetotalpopulation,andisthusasubsetofthetotalpopulationdesign.Thethreedesignsdifferintheextenttowhichthesameorcomparablecasesarestudiedfromoneperiodtothenext.Thisdistinctionhasimportantimplicationsforwhichtypesoflongitudinalanalysisarepossiblewitheachdesign.RepeatedCross-SectionalDesignsIntherepeatedcross-sectionaldesign,theresearchertypicallydrawsindependentprobabilitysamplesateachmeasurementperiod.Thesesampleswilltypicallycontainentirelydifferentsetsofcasesforeachperiod,ortheoverlapwillbesosmallastobeconsiderednegligible,butthecasesshouldbeascomparablefromoneperiodtoanotheraswouldbethecaseinatotalpopulationdesign.Anexampleoftherepeatedcross-sectionaldesignistheNationalSurveyofYouth,conductedbyMartinGoldandhisassociates(GoldandReimer,1975;WilliamsandGold,1972).Goldandhisassociatescollecteddataontwoseparatenationalprobabilitysamplesofyouth,onein1967andonein1972.Fromthesesamples,theywereabletoinferthatdespitechangesinarrestratesofjuvenilesfrom1967to1972,therewaslittleactualchangeinself-reporteddelinquentbehaviorfrom1967to1972.Johnstonetal.(annual)havecollecteddataonnationalprobabilitysamplesofhighschoolseniorssince1975.Theirrepeatedcross-sectionaldata,likethedatacollectedbyGoldandhisassociates,permittheexaminationoftrendsinattitudesandbehaviorswithinaspecificagegroupovertime.(LongitudinalprospectivepaneldataarealsoavailablefromtheMonitoringtheFuturestudyforasubsampleofthosewhowereoriginallysampledashighschoolseniors.)Theprincipallimitationstotherepeatedcross-sectionaldesignareitsinappropriatenessforstudyingdevelopmentalpatternswithincohortsanditsinabilitytoresolveissuesofcausalorder.Bothoftheselimitationsresultdirectlyfromthefactthat54 华中科技大学硕士学位论文intherepeatedcross-sectionaldesign,thesamecasesarenotmeasuredrepeatedlyorformultipleperiods.Developmentalpatternsmaybeexaminedbylookingatdifferencesacrossages(i.e.,acrosscohorts)foreachmeasurementperiodinwhichmultiplecohortsaremeasured,buttheonlyadvantageoftherepeatedcross-sectionaldesignoverapurecross-sectionaldesignforthispurposeisthattherepeatedcross-sectionaldesignbuildsinthepossibilityofreplicatingcross-sectionalresultsacrossperiods.Thisreduces,butdoesnoteliminate,thepossibilitythatthedevelopmentalpatternssuggestedbyintercohortcomparisonsmaynotreflectthedevelopmentalpatternsindicatedbyintracohortcomparisons.Forcausalorder,theabsenceofdataonthesamecasesfortwoormoretimesmeansthattemporalorderanalysisandlinearpanelanalysisarenotpossible(unless-andthisisquiteunlikely-anadequateprocedureformatchingdifferentcasesmeasuredindifferentperiodsisavailable).Themeasurementofchangeinrepeatedcross-sectionaldesignscanbemadeonlyattheaggregatelevel,forthesampleorforsubsamples(e.g.,malesandfemales,ethnicgroups,socialclasses).Itcannotbemadeatthelevelofindividualcases.Limitationssuchasthesehaveledmanyauthors,particularlyindevelopmentalpsychology(e.g.,BaltesandNesselroade,1979)toarguethattherepeatedcross-sectionaldesignshouldnotreallybeconsideredalongitudinaldesign.Baltesetal.(1979)nonethelessconsidertherepeatedcross-sectionaldesign(whichtheydescribeasacross-sectionalsequence)inthestudyofcohorteffects.Therepeatedcross-sectionaldesignisgenerallyappropriateformeasuringaggregateperiodtrends.ifcausalorderisalreadywellestablished,andifthetimelagbetweencauseandeffectcanbeassumedtobeshortrelativetotheintervalbetweenmeasurementperiods,therepeatedcross-sectionaldesignmayalsobeusedforcausalanalysisinmodelsthatareessentiallycross-sectionalinnature.Ifintercohortandintracohortdevelopmentaldifferencescloselyreflectoneanother,thereisnoobstacletotheuseoftherepeatedcross-sectionaldesignwithmultiplecohortsfortheanalysisofdevelopmentalpatterns,againinanessentiallycross-sectionalanalysis.Forbothcausalinferenceand55 华中科技大学硕士学位论文developmentalanalysis,othertypesoflongitudinaldesignsareneededtoindicatewhetherarepeatedcross-sectionaldesignmayreasonablybeused.Finally,therepeatedcross-sectionaldesignpermitstheresearchertoreplicatecross-sectionalresultsfromoneperiodtoanother.If,however,weareinterestedinintracohortdevelopmentalchanges,orinascertainingcausalorder,otherlongitudinaldesignsfordatacollectionarepreferable.RevolvingPanelDesignsRevolvingpaneldesignscollectdataonasampleofcaseseitherretrospectivelyorprospectivelyforsomesequenceofmeasurementperiods,thendropsomesubjectsandreplacethemwithnewsubjects.Therevolvingpaneldesignmayreduceproblemsofpanelmortalityandrepeatedmeasurementinprospectivestudies(tobediscussedbelow),orproblemsofextendedrecallperiodsinretrospectivestudies.Retentionofaparticularsetofcasesoverseveralmeasurementperiodsallowsshort-termmeasurementofchangeontheindividualorcaselevel,short-termanalysisofintracohortdevelopmentalchange,andpanelanalysis.Replacementofthesubsamplethatisdroppedinameasurementperiodwithanewbutcomparablesubsampleofcasespermitsanalysisoflong-termpatternsofaggregatechange.Ifthetimelagbetweencauseandeffectissmallerthanthetime(periods)forwhichcasesareretainedinthesample,analysisoftemporalandcausalorderispossible.Thecombinationoflongitudinaldatainvolvingrepeatedmeasurementonsomecaseswithdatathatdonotinvolverepeatedmeasurementonothersmaypermitcomparisonsthatcanindicatewhetherrepeatedmeasurementisproducinganybiasinthedata(e.g.,increasedordecreasedwillingnesstoreporteventsaftereitherbuildingupsomeleveloftrustorfindingoutthatreportingleadstolongandtediousfollow-upquestions).TheNationalCrimeSurvey,fundedbytheDepartmentofJusticeandimplementedbytheU.S,CensusBureau,isagoodexampleofarevolvingpaneldesign.Householdmembersareperiodicallyinterviewedaboutcriminalvictimizationofhouseholdmembersforsevenoffenses(rape,robbery,aggravatedassault,simpleassault,burglary,larceny,andmotorvehicletheft).Householdsareselectedforinclusionbyprobabilitysampling,56 华中科技大学硕士学位论文interviewedseventimes(atsixmonthintervals)overathree-yeartimespan,thendroppedfromthesample,andreplacedbynewlyselectedhouseholds.Withthehouseholdastheunitofanalysis,thispermitsanalysisofbothshort-termtrendsinratesofvictimizationwithinhouseholds,andbothshort-andlong-termtrendsinaggregateoraverageratesofvictimization.Longer-termdevelopmentaltrendswithinhouseholds,however,cannotbeanalyzed.TheKansasCityPolicepatrolexperiment(Kellingetal.,1974)alsousedarevolvingpaneldesigntocollectdataonvictimization.Asampleof1,200householdswasusedinthepretest,andhalfofthehouseholdswereretainedandtheotherhalfreplacedfortheposttest.Asaresult,itwaspossibletocomparethosewhohadbeeninterviewedtwice(pretestandposttest)withthosewhohadbeeninterviewedonlyonce(posttestonly)andtoruleoutthepossibilitythattheresults(nodifferencebetweencontrolandexperimentalpolicebeats)wereaconsequenceofbiasfromrepeatedinterviewing.Therevolvingpaneldesignwouldalsobeappropriateforlongitudinalresearchonindividualswithinaparticularagerange,suchasadolescentsorthoseoverage65,inordertopreventseriousproblemsofsampleattritionasrespondents"ageout"ofadolescenceordieinoldage.Therevolvingsampleforlimitedagerangespermitstheresearchertomaintainasufficientnumberofcases(see,e.g.,KraemerandThiemann,1987)forcomplexanalysesofsmallsubsampleswithinthelargersample.LongitudinalPanelDesignsInalongitudinalpaneldesign,thesamesetofcasesisusedineachperiod.Inpractice,theremaybesomevariationfromoneperiodtoanotherasaresultofmissingdata.Forexample,whencasesareindividuals,someofthoseindividualsmaydiebetweenonemeasurementandthenext,othersmaynotagreetocooperate,andothersmaymovetonewlocationsandnotbefoundbytheresearcher.Allofthesearesourcesofpanelattrition,andapply.primarilytoprospectivepaneldesigns,inwhichmeasurementordatacollectionoccursduringmorethanoneperiod.Panelattrition,assuch,isnotaproblem57 华中科技大学硕士学位论文forretrospectivepaneldesigns,inwhichdatacollectionmayoccuronlyonce,atoneperiod,butinwhichdataarecollectedfortwoormoreperiods(priortoorduringtheperiodinwhichthedataarebeingcollected).Inretrospectivepaneldesigns,however,theremaybesamplingbiasasaresultofexcludingrespondentswhohavediedbythelastperiodforwhichthedataarecollected,orfromwhomdatawouldotherwisehavebeenavailableforearlierperiodsbutnotforthelastperiod.Inbothretrospectiveandprospectivepaneldesigns,missingdatamayresultfromfailureoftherespondenttorememberpastevents,behaviors,orattitudes,orfromunwillingnessbytherespondenttodivulgesomeinformation,andalsofrominabilityoftheresearchertolocateorobtaincooperationfromsomerespondents.Inprinciple,thereneedbenodifferenceinthequalityofthedataobtainedinprospectiveandretrospectivepaneldesigns,butdifferencesdooccurinpractice(asdiscussedinChapter4).Alongitudinalpaneldesignthatincludesmultiplecohorts(asillustratedinFigure3.2)shouldpermitanytypeoflongitudinalanalysis,ifthenumbersofperiodsandcohortsaresufficient.Singlecohortpaneldesignsdonotpermitcomparisonsbetweencohorts,butmultiplecohortdesignspermitanalysisofage,period,andcohorteffects;descriptionsofdevelopmentalandhistoricalchange;analysisofthetemporalorderofevents;linearpanelanalysis;andcausalanalysis.Asanexample,theNationalYouthSurvey,conductedbyDelbertS.Elliottandhisassociates(Elliottetal.,1983,1985,1989)selectedanationalprobabilitysampleofyouthaged11-17(sevencohorts)in1976andhascontinuedtoreinterviewthissamesampleperiodically,mostrecentlyin1990.DatafromtheNationalYouthSurveyhavebeenusedtoestimateandanalyzeperiodtrendsinillegalbehavior(Menard,1987a),toseparateage,period,andcohorteffectsindruguse(Elliottetal.,1989;MenardandHuizinga,1989)andillegalbehavior(Elliottetal.,1989;MenardandElliott,1990b),totestandreplicateatheoreticalmodelofillegalbehaviorinadolescenceandyoungadulthood(Elliottetal,1985,1989),andtoascertainthetemporalorderofvariablesinordertoresolvecontradictoryclaimsbycompetingtheories(Menardand58 华中科技大学硕士学位论文Elliott,1990a).Theseexamplesillustratethebreadthofanalysisandresultspossiblewithmultiplecohortprospectivepaneldata.OtherVariationsThedesignsdiagrammedinFigure3.2arenottheonlypossibledesignsforlongitudinalresearch.Itispossible,forexample,tohavearevolvingsampleinwhichsubsamplesmaybedroppedforoneperiod,thenreincludedinthesampleinasubsequentperiod.Itisalsopossibletohaveapaneldesigninwhichcasesaredropped,withoutreplacement,aftertheymeetsomecriterion(e.g.,age21).Thislatterdesignwouldresultinamonotonicallydecreasingsamplesizethatcouldposeproblemsforanalysisofdatafromlateryearsofthestudy.Thegeneralconsiderationsassociatedwiththevariousdesignsfordatacollectiondonotchange,however,withmodificationsofthefourdesignspresentedinFigure3.2,andvariationsonthesebasicdesignsmustbeevaluatedintermsoftheiradequacyfordescribingshort-andlong-termhistoricaltrends(periodeffects);describingintercohortandintracohortdevelopmentalchanges(ageeffects);separatingage,period,andcohorteffects;andascertainingnotonlythestrengthbutalsothedirection(e.g.,bytemporalorderanalysisorlinearpanelanalysis)ofcausalinfluences.Totalpopulationdesignsandlongitudinalpaneldesignscanbeusedforpracticallyanytypeoflongitudinalanalysis,givenasufficientnumberofcohortsandmeasurementperiods.Otherdesignsaremorelimited,andtheirappropriatenessmustbejudgedinthecontextofaparticularresearchproblem.Witheachofthesedesigns,thenumberofcasesandperiodsmayvary,andasaresultofthisvariation,differentmethodsofanalysismaybeappropriate.Ifboththenumberofcasesandthenumberofperiodsarelarge(e.g.,severalthousandcasesand100ormoreperiods),thepossibilitiesforanalysisarelimitedonlybythequalityofthedata.Ifthecasesandperiodsarebothfewinnumber(e.g.,1-10casesover2-10periods),thenanyquantitativeanalysismaybeproblematic.Morecharacteristically,thenumberofcasesmaybefairlylarge(e.g.,1,000casesattheindividuallevel,or50casesattheaggregate59 华中科技大学硕士学位论文level)andthenumberofperiodsmaybesmall(2~4),asituationforwhichlinearpanelanalysis(KesslerandGreenberg,1981)isoneappropriatemethod.Alternatively,thenumberofcasesmaybesmall(1-10)andthenumberofperiodsmaybelarge(50ormore),aconditionmostamenabletotime-seriesanalysis(McClearyandHay,1980;Wei,1990).Thenumberofcasesisinprincipleindependentofthetypeofdesign.Inatotalpopulationdesign,forexample,attheindividuallevel,thetotalpopulationofatribalsocietymaynumberfewerthan100.Inaggregateanalysis,acohortorapopulation,ratherthanitsindividualmembers,maybetheunitofanalysis,andthenumberoftheseaggregateunitsmaybesmall.Attheotherendofthecontinuum,therevolvingsampleintheNationalCrimeSurveyincludesmorethan100,000individualsfrom60,000households.Allofthesepossiblecombinationsoftypeofdesignandnumberofcasesareincludedwithinthebroadcategoryoflongitudinalresearch.4.ISSUESINLONGITUDINALRESEARCHThereisnothinguniqueaboutthemethodsusedtocollectdataforlongitudinalresearch.Longitudinalresearch,likecross-sectionalresearch,reliesuponthreefundamentalmethodsofgatheringdata:askingpeoplequestions,observingpeople"sbehavior,andobservingthephysicaltracesorresultsofpeople"sbehavior.Datamaybecollectedforasinglecase,asmallnumberofcases,oraverylargenumberofcases;foreveryoneinasociety,foraprobabilitysampleofpeopleinasociety,orforparticularindividualswhomayormaynotreflecteitherthesocietyasawholeorsomesegmentofsociety.Datamaybekeptandcodedatthelevelofindividualsoraggregatedintohouseholds,censustracts,ornations.Periodsforwhichdataarecollectedmaybeshort,consistingofafewhours,orlong,consistingofseveralyears.Standardizeddata-collectioninstrumentsmaybeused,ordatacollectionmaybeaninteractiveprocessthatisuniquetoeachcase.Bothlongitudinalandcross-sectionalresearchmayinvolvecasestudies,ethnographies,experiments,samplesurveys,censuses,orarchivaldatacollection.Theoneprincipaldistinctionbetweenlongitudinalandcross-sectionaldata60 华中科技大学硕士学位论文collection,asnotedearlier,isthatinlongitudinalresearch,dataarecollectedoneachvariableforatleasttwoperiods.Theproblemsthatariseregardingdataqualityincross-sectionalresearchthusariseinsimilarfashionforlongitudinalresearch.Problemsofinternalandexternalmeasurementvalidity;measurementreliability;sampling;appropriatenessofquestionstothepopulationbeingstudied;adequacyoftherandomizationproceduresinexperimentaldesigns;effectsofinteractionbetweensubjectsorrespondentsandexperimenters,interviewers,orobservers(inmicrosocialdatacollection);issuesoftherelevanceoftheresearch(dowemeasurewhatisimportantorjustwhatiseasilymeasurable?);andresearchcostsareasimportantinlongitudinalresearchastheyareincross-sectionalresearch.Someoftheseissuesareevenmoreproblematicforlongitudinalthanforcross-sectionalresearch.Forexample,biasesinsamplingmaybeamplifiedbyrepetitioninrepeatedcross-sectionaldesigns,oreffectsofresearchersonrespondentsmaybeamplifiedbyrepeatedcontactbetweenresearchersandsubjectsinprospectivepaneldesigns.Generaldiscussionsoftheseissuesareavailableelsewhere(e.g.,Babble,1989;Bailey,1987;Williamsonetal.,1982).Here,thefocusisonissuesandproblemsthatarecharacteristicoflongitudinalratherthancross-sectionaldesigns.GenesisVersusPredictionZazzo(1967)arguedthatadistinctionshouldbemadebetweenthestudyofthegenesisofbehaviorandthestudyofthepredictionofbehavior.Prediction,accordingtoZazzo,isconcernedwiththestabilityofpopulationcharacteristicsovertimeandtheextenttowhichexternalinfluences(changesinenvironment,therapeuticintervention)maymodifythosecharacteristics.Genesis,bycontrast,focusesonstagesorsequencesofqualitativechanges,withthegoalofdiscoveringlawsofgrowthordevelopmentalchange.AccordingtoZazzo,thestudyofthegenesisofbehaviormayrequiretheuseofmorequalitativemethods:discardinglargesamplesandpredefinedhypothesesandvariablesinfavorofintensivestudyofasmallnumberofcases,initiallywithnohypothesesabout61 华中科技大学硕士学位论文whatvariablesareimportant,anddiscardingage(andchronologicaltime)asacontinuumalongwhichchangeismeasuredinfavorofmeasuringchangewithrespecttopriorstates.ZazzocitedtheworkofPiaget(see,e.g.,Piaget1948,1951,1952)asanexampleofresearchongenesis.Withoutdenyingthatthefocusofmostlongitudinalresearchhasbeenonprediction,ratherthangenesis(asdefinedbyZazzo),wemaynonethelessnotethatresearchongenesishasnotbeenneglectedateitherthemacrosocialorthemicrosociallevel.Atthemacrosociallevel,Rostow(1960)proposedatheoryofstagesofeconomicdevelopment,Black(1966)attemptedtodefinestagesofpoliticaldevelopmentorpoliticalmodernization,andthetheoryofthedemographictransition,initsvariousincarnations(e.g.,Caidwell,1976;Davis,1963;Notestein,1945;Thompson,1929),althoughnotwithoutitscritics(VandeWalleandKnodel,1980),hasproventobeadurableperspective,andasourceforagreatdealofresearchindemography(see,e.g.,Menard,1990;TolnayandChristenson,1984).Atthemicrosociallevel,Kandelandherassociates(Kandel,1975;KandelandFaust,1975;KandelandLogan,1984;YamaguchiandKandel,1984a,1984b)haveexaminedthesequencingofstagesofdruguse,andfoundevidenceofprogressionfromalcoholtomarijuanatootherillicitdrugs,withfewmovingtoamoreadvancedstagewithoutfirstenteringanearlier(lessserious)one.Kandel"swork,whichhasbeenconfirmedbyotherresearchers(Huizingaetal.,1989),hasalsodemonstratedthatresearchongenesisofbehaviorneednotbeisolatedfrompredictiveresearch.Sheandherassociateshavenotonlydescribedsequencesofprogressionindruguse,buthavealsoexplainedunderwhatcircumstancesprogressionfromonesubstancetoanotherismostlikely.Toobtainamorecompleteaccountofpatternsofdevelopment,then,wemaystudyboththesequencingofbehaviorandthetimingandcorrelatesofprogressionfromonestagetoanother.ChangesinMeasurementOverTimeIn1930,Redfield(1930)publishedtheresultsofhisethnographicstudyofaMexican62 华中科技大学硕士学位论文village,Tepoztlan,inwhichhedescribedthevillageasharmoniousandthepeopleaswelladjustedandcontent.Twenty-oneyearslater,Lewis(1951)publishedhisethnographicstudyofthesamevillage,andincontrasttoRedfield,Lewisfoundconsiderableevidenceofviolence,cruelty,andconflict,bothwithinthevillageandinitsrelationshipswithothervillages(GistandFava,1974:513).Fifty-fiveyearsafterMead(1928)publishedherethnographicfindingsfromSamoa,Freeman(1983)questionedandcontradictedMead"sfindingswithhisownethnographicevidencefromSamoa.Becauseofthedifferencesintime,itisunclearwhetherthedifferencesinfindingsreflecttruechangesormerelydifferentbiasesororientationsonthepartoftheobservers.Theproblemssovividlyillustratedbydiscrepantethnographicstudiesmayalsoariseinsurveyresearch.Martin(1983)describedunsuccessfulattemptstoreplicatesurveysofvictimizationandsurveysofconfidenceinAmericaninstitutionsinrepeatedcross-sectionalsurveydesigns.Withtovictimization,anUrbanInstitutestudyexplicitlydesignedtoreplicatethestandardproceduresusedbytheCensusBureauinconductingtheNationalCrimeSurveyobtainedvictimizationrateslessthanhalfthoseobtainedforacomparablepopulationintheNationalCrimeSurveyconductedoneyearlater,andloweralsothantheratesobtainedinatelephonesurveyconductedataboutthesametime.WithregardtoconfidenceinAmericaninstitutions,nearlyidenticalmeasuresusedbyHarrispollsandNationalOpinionResearchCenterstudiesproducednotonlydifferentcross-sectionalresults,butdifferenttrendsaswell.Incontrast,Gold"s(GoldandReimer,1975;WilliamsandGold,1972)repeatedcross-sectionalstudyofdelinquentbehaviorappearstohavebeensuccessfulinreplicatingboththesamplingproceduresandthesubstantiveresultsfromthefirstwavetothesecond.OneadvantagetothesurveysconductedbyGoldandhisassociateswaswithrespecttotheprincipalresearcher.Withoutintimateknowledgeofnotonlyformalprocedures,butinformalaspectsoftheresearchaswell,itmaybeextremelydifficultorimpossibletocompletelyreplicatepreviouswavesofdatacollectioninarepeatedcross-sectionalor63 华中科技大学硕士学位论文prospective(totalpopulation,revolvingpanel,longitudinalpanel)longitudinaldesigns.Theproblemofstandardizationacrossperiodsorwavesofdatacollectionmaybedifferentfordifferentdata-collectionmethods.Standardizationacrosswavesinsurveyresearchisaidedbyuseofthesamequestionnairefromonewaveofdatatoanother,butvariationinthewaythequestionnaireisadministeredbyinterviewersatdifferentwavesmaystillposeaproblem;thisisanissue,primarily,ofinterviewertraining.Formorequalitativeresearch,the"instrument"fordatacollectionmaybetheobserver,anddifferentobserversmayhavedifferentbiases,focusondifferentaspectsofthesettingorbehaviorinthesetting,andreachverydifferentconclusions.Someresearchershavesuggestedthatthefindingsfromparticipantobservationstudiesmaybeinherently"idiosyncraticanddifficulttoreplicate”(BlalockandBlalock,1982:97).Lackofstandardizationindatacollectionacrosstimemayariseforlegitimatereasons.Ifasurveybeginswithadolescentrespondentsandfollowsthemuntiltheyareintheirlatetwentiesorearlythirties,questionsabouthowfavorablytheyviewschoolmaybeimportantintheearlyyearsofthesurvey,andquestionsabouthowfavorablytheyviewtheirjoboroccupationmaybemoreimportantlater.Respondentswillalsobemakingtransitionsfromfamiliesoforientation(parentsandsiblings)tofamiliesofprocreation(spousesandchildren).Ifattitudestowardworkorschool,andfamilystress,aretheoreticallyimportantpredictorsofsomebehavior(e.g.,druguse),itmaymakesensetomatchthechangesinrespondents’liveswithcorrespondingchangesinthevariablesthataremeasured.Twoquestionsareimportanthere.First,canonevariablemeasuredatonestageofarespondent’slifebeequatedwithaconceptuallysimilarvariable(e.g.,stressinfamilyoforientationandstressinfamilyofprocreation)atalaterstage?Second,isthetransitionabruptorgradual?Dorespondentsundergoaperiodwheninvolvementinbothcontextsisimportant(e.g.,workingandgoingtoschoolatthesametime),oristhechangeanabruptonethatinvolvescompletelyleavingonecontextandimmersingoneselfintheother?Bymeasuringthevariablesforbothcontextsatthesametime,itispossibleto64 华中科技大学硕士学位论文directlyestimatetherelationshipbetweenthetwovariables,andtoseewhethertheyhavesimilarpatternsofrelationshipswithothervariables.Ifthevariablesarehighlycorrelated,andiftheyhavethesamepatternofrelationshipswithothervariables,astrongargumentforconcurrentvalidity(Williamsonetal.,1982;ZellerandCarmines,1980)maybeestablished.Otherreasonsforchangesininstrumentationincludenewhypotheses,eitherfromthestudyitselforfromgeneraladvancesintherelevantfieldsofsocialscience,andchangesinresearchstaffandtheirrespectiveinterests(WallandWilliams,1970).Theadditionofnewhypothesestothosewithwhichthestudybeganmayalsobeasourceofchange.Thedangersinvolvedwitheachofthesechangesarereadilyapparent.Ifotherstudieshaveclearlydiscreditedorrefutedthehypothesesuponwhichtheresearchprojectisbased,itbecomespracticallymeaninglesstocontinuetheresearch.Theutterrefutationofatheoryorhypothesisis,however,exceedinglyrareinthesocialsciences,andeventhen,thedatamayhavesomeutilityforreplicatingtherefutationoftheoldhypothesis.Alternatively,shiftinghypotheses,variables,andmeasurementspartwaythroughanongoinglongitudinalresearchprojectwouldmeanthatthetwopartsoftheresearch,beforeandaftertheshift,mightnotbecomparable.Thispotentiallydestroystheutilityofthedata,bothbeforeandaftertheshift,forthesortoflongitudinalanalysisthatwasoriginallyintended.Inaddition,itrunstheriskofhavingone"sresearchdictatedbywhatmaylaterberecognizedasatransienttheoreticalfashion.PanelAttritionInalongitudinalstudyofadolescentdruguse,NewcombandBentler(1988)experienceda55%attritionrateoveraneight-yearinterval.MurrayandErickson(1987)reportedanattritionrateof50%inastudyofmarijuanause.Otherstudieshavefaredbetter.TheNationalYouthSurvey(Elliottetal.,1989)reportedanattritionrateof13%overaneight-yeartimespan.Clarridgeetal.(1977)wereabletoachieveanattritionrateof11%inafollow-upofWisconsinhighschoolseniors17yearsaftertheywerefirst65 华中科技大学硕士学位论文interviewed.OtherprospectivelongitudinalpanelssuchasthePanelStudyofIncomeDynamicsandtheSurveyofIncomeandProgramParticipationreportretentionrates(forthosewhorespondedinthefirstperiodofdatacollection)of75-80%(KaHonetal.,1989).Insofarasrespondentsarelostinlaterwavesofdatacollection,themeasurementofchangemaybeconfoundedbecausethoserespondentswhoarelostmaydifferfromthosewhoareretainedinsomesystematicway(theymayhavehaddifferentaveragevaluesonvariablestobeginwith,ortheymayhavechangedinwaysdifferentfromtherestofthesample).Thisisespeciallyseriousiflossescomedisproportionatelyfromthosewithextremevaluesonthevariablesonwhichtheresearchfocuses,forexample,themostfrequentillicitdrugusersorthemostseriouscriminalsinstudiesofillegalbehavior.Itisthusnotonlythemagnitudeoftheattritionbutalsothepatternofattritionwithrespecttocriticalvariablesinthestudythatmaybeproblematic.Attritionrateswillinevitablybehighiftheresearcherfailstomaintaincontactwiththeresearchsubjects.Burgess(1989)andClarridgeetal.(1977)discusstechniquesoftracingrespondentsinsomedetail.Thesetechniquesincludeobtaining,onthefirstandsubsequentinterviews,namesandaddressesofparents,otherrelatives,friends,orotherindividualswithwhomtherespondentislikelytostayintouch,andrepeatedannualmailings(e.g.,birthdaycardsorotherspecialoccasiongreetingcards)witharequesttothepostofficetosupplyaforwardingaddressiftherespondenthasmoved.Inordertomaintainlowattritionrates,substantialresourcesmustbeavailablefortrackingrespondents.Clarridgeetal.(1977),ina17-yearfollow-upsurveyofmorethan10,000Wisconsinhighschoolseniors,wereabletolocate97.4%oftheoriginalrespondents,andtoobtaininterviewsfrom88.6%oftheoriginalsample.Clarridgeetal.usedavarietyofsources,beginningwithparentsandincludingcollegesandhighschools,thepostoffice,militaryservice,neighbors,andfriendsoftherespondentstoobtaintheirhighresponserates.Burgess(1989)concludedthatitwasreasonableinsurveyingmostgroupsinthe66 华中科技大学硕士学位论文populationtoexpecttocontactortrace80-90%ofallrespondents,evenoverextendedtimeintervalsbetweensurveys.Onemayproperlyquestionwhethertheresultsofanalysesofpaneldatawithattritionratesof50%ormorecanreasonablybegeneralizedbeyondtherespondentswhowereretainedinthestudy.Tosomeextent,theimpactofpanelattritiononthedistributionofvariablesandthesubstantivefindingsforadatasetmaybeascertainable.Thebinomialtest(Bulmer,1979)maybeusedtotestwhethertheproportionofindividualsindifferentdemographiccategories(maleorfemale,whiteornonwhite,andsoon)changessignificantlyovertime.Othertestsofstatisticalsignificancemaybeusedtotestwhether,atthefirstwaveofdatacollection,thosewhocontinuedinlaterwaves(stayers)differedfromthosewhowerelaterlosttothestudy(leavers)withrespectto(a)valuesonparticularvariables,(b)strengthofrelationships(e.g.,correlations)amongvariables,or(c)thestructureofrelationships(e.g.,multipleregressionequationsorcovariancestructure)amongsetsofthreeormorevariables.Suchtestsmayuncoverevidenceofsamplevariabilityoversuccessivewavesofdatacollection.Still,itremainspossiblethatsomesourceofsamplevariabilitythatsignificantlyaffectsthesubstantiveoutcomeoftheanalysismaybeoverlooked.Forexample,thosewithdifferentbehavioraltrajectories(e.g.,increasingasopposedtodecreasingdruguse)maybedifferentiallylikelytoremaininordropoutofthepanel,andthismaynotbereadilydetectableusingthemethodssuggestedabove.Thiscouldseriouslybiassubstantiveresultssuchastheestimationandexplanationofdevelopmentaltrendsinbehavior,andcouldbeextremelydifficulttodetect.Inretrospectivepaneldesigns,theproblemofattritiontakesadifferentform,onenotamenabletoassessmentbytheuseoftestsofstatisticalsignificance.Insteadofproblemsassociatedwithrespondents"leavingthepanelafterthefirstwaveofdatacollection,retrospectivestudiesmayhaveproblemsofselection.Especiallyforlong-termstudies,retrospectivestudiesmaymissindividualswho,forexample,diedormovedoutoftheareafromwhichthesamplewasdrawn,andwhodidsoduringtheperiodforwhichthe67 华中科技大学硕士学位论文datawerecollected.Thoseindividualsmaydiffersystematicallyfromtherestofthepopulation.Forexample,frequentusersofillicitdrugsmayhavehighermortalitythantherestofthepopulation.Ifthisisso,thenfrequentillicitdruguserswillbeundersampledfortheperiodofthestudy,andthismaybiasestimatesofchangeinratesofillicitdruguse.Ineffect,thisisaproblemofattrition,butattritionthattakesplacebeforethesampleisdrawn.Itismuchmoredifficulttodetectandmeasurethistypeofattritionthantheattritionthatarisesinconjunctionwithprospectivepaneldesigns.RepeatedMeasurementandPanelConditioningTheeffectofpanelconditioning(e.g.,Kaltonetal.,1989)inthecontinuedstudyofasetofrespondentsisaproblemprimarilyformicrosocial,longitudinalpaneldesigns,includingexperimentalandquasi-experimentaldesignsthatinvolveapretest.Effectsofrepeatedtestingmaydamageinternalvalidityinexperimentalandquasi-experimentaldesigns,buttheuseofcontrolgroupsmayallowtheresearchertomeasurethiseffectand,ifitispresent,todeterminewhethertherearetreatmenteffectsinadditiontothechangesresultingfromrepeatedmeasurement.Inoneexampledrawnfromsurveyresearch,thevalidityoftheNationalCrimeSurveyappearstosufferfromeffectsofrepeatedinterviewing(Cantor,1989).MenschandKandel(1988)foundevidenceofsimilarproblemsinastudyofdruguseconductedbytheCenterforHumanResourceResearchatTheOhioStateUniversity.Willingnessofrespondentstoanswerquestionsinawaythatwillevokeaknownresponse(e.g.,follow-upquestions)isonlyonethreattovaliditythatemergeswiththeuseofcontinuedstudyofthesamecases.Moregeneralunwillingnesstoparticipateinthestudymayalsoresultfromcontinuedstudyandmayresultinattrition.Yetanotherpossibilityisthatrespondentswillchangeasaresultofparticipationinthesurvey.Sincetheintroductionofadepressionscaleinthe1984waveoftheNationalYouthSurvey,respondentswhoreportedfeelingdepressedandhavingsymptomsofdepressionaccordingtoaclinicallybaseddepressionscalehavehadtheoptionofrequestingan68 华中科技大学硕士学位论文anonymousreferraltoamentalhealthprofessionalorfacility.Thesimplefactofhavingthisoptionmayalterthealtitudesorbehaviorofthoserespondents(whoconstituteasmallproportionofthetotalsample).Collinsetal.(1989)reportedthatinastudyoffamilycaregiversofelderlyrelatives,52%identifiedatleastoneeffectofstudyparticipation,mostofteninvolvinghowthey(thecaregivers)copedwiththestrainsofprovidingin-homecarefortheirelderlyrelatives.RubinandMitchell(1978)reportedthatcouplesinalongitudinalstudyofthedevelopmentofrelationshipswerealsoaffectedbytheresearch.Acommonpatternseemstobefortherespondentstobemoreawareofandintrospectiveabouttheirattitudes,emotions,andbehavior.Itisdifficulttotellwhetherthis,inturn,producessubstantialchangesinattitudes,emotions,orbehavior.Itisalsounclearwhethertheseeffectswouldoccurastheresultofasinglecross-sectionalstudy,orwhethertheyarepeculiartolongitudinalresearchinvolvingrepeatedcontactbetweenresearchersandrespondents.Itisnotsurveyresearchalonethatissusceptibletoeffectsofcontinuedstudy.Anyprospectivemicrosocialresearch,includingobservationalresearch,inwhichthereiscontactbetweentheresearcherandtheresearchsubjectorinwhichthesubjectsareawarethattheyarebeingobservedrisksthistypeoferror.Formacrosocialresearch,dependingonhowdataarecollectedoraccumulated,thismaybelessofaproblem.ThelengthoftimeforwhichtheUnitedStateshasbeencompilingofficialcrime,census,andvitalstatisticsdatadoesnotappeartohavenegativelyaffectedthevalidityofthosedataovertime.Ifanything,theoppositeisthecase.CensuscoveragehasbecomeincreasinglycompleteoverthedurationoftheU.S.Census,includingthepastseveralcensuses(Robey,1989),andthoroughnessofcoverageofpolicejurisdictionsfortheFBIUniformCrimeReportshasalsoincreasedovertime.Similarly,internationalstatisticsonpopulation,economicdevelopment,andothernationalcharacteristicsdonotappeartohavegottenworseovertime.Note,too,thatretrospectivestudiesmaynotbesusceptibletotheproblemofcontinuedstudy(althoughretrospectivestudies,likeprospectiveand69 华中科技大学硕士学位论文cross-sectionalstudies,mayhaveproblemsiftheinterviewprocessseemstoolongandtedioustotherespondents).Theproblemofcontinuedstudyofapanelofsubjectsisthusprimarilyofconcernformicrosocial,prospectivestudies.Evenformicrosocial,prospectivestudies,itmaybepossibletoavoidtheproblem,eitherbyadjustingtheintervalbetweendata-collectionwaves(theone-tothree-yearintervalusedintheNationalYouthSurvey,asopposedtothesix-monthintervalusedintheNationalCrimeSurvey),byvaryingthedesignofthequestionnairefromwavetowave(althoughthatmayraiseanothersetofissuesregardingthecomparabilityofdatafromonewaveofdatacollectiontoanother),orbysuccessfullyencouragingahighlevelofcommitmenttotheresearchonthepartofsubjectsandresearchstaff.RespondentRecallSorensonetal.(1980)arguedthatretrospectivedesignsprovidedaccurateaccountsofpastdelinquentbehavior.Todrawthisinference,however,theyreliedonacomparisonofcross-sectionalsurveysfromtwodifferentpopulations(ContraCostaCounty,California,in1965andtheSt.Louis,Missouri,metropolitanareain1981and1982).Basedonthefactthatthecross-sectionaldataforSt.Louisin1965(collectedretrospectivelyin19811982)producedratesofillegalbehaviorsimilartothosefoundintheContraCostaCountydata(collectedprospectively)for1965,theyconcludedthattheretrospectivedataforSt.Louiswerevalid.Thedefectofsuchanargumentisthatanysimilaritybetweenthetwomaybeafortuitouscombinationoftrendsinthetwoareasthatproducecoincidentratesinaparticularperiod.Inparticular,ifContraCostaCountyhadlowerratesofillegalbehaviorin1965thanSt.Louis,andiftheretrospectivedataforSt.Louisunderreportedpastillegalbehavior,thetwomightagreeonratesofillegalbehaviordespiteproblemsinthevalidityoftheretrospectivedata.Amuchbetterprocedurewouldbetocompareprospectiveandretrospectivedatafromthesamerespondents.MenardandElliott(1990a)useddatafromtheNationalYouthSurveytocompare(a)70 华中科技大学硕士学位论文trendsintheprevalenceofoffending(thepercentageoftherespondentsinthesamplewhoreportedhavingcommittedaparticularoffense)basedonone-,two-,andthree-yearrecallperiods,and(b)theprevalenceofseriousoffendingbasedonprospectivedatawithaone-yearrecallperiodandretrospectivedatawithavariablerecallperiod(typically10years).Comparisonsofone-,two-,andthree-yearrecallperiodsforgeneralnondrugoffending,serious(Index)nondrugoffending,marijuanause,andotherillicitdruguse(polydruguse)areillustratedinFigure4.1.Thesolidlinesrepresenttrendsbasedontheprospective,one-yearrecalldatafor1976-1983(annualdatawerenotavailablefor1981and1982;thesolidlinessimplyconnectthedatapointsfor1980and1983).Thedashedlinesrepresenttrendsbasedonthree-yearrecalldatafor1981andtwo-yearrecalldatafor1982(andconnectedtothedatapointsfor1980and1983).For1981-1983,theprospectivedata(basedon1980and1983)indicatestableordecliningtrendsforgeneraloffending,Indexoffending,andmarijuanause,buttheextendedrecalldata(for1981and1982)indicatepositivetrends.Forpolydruguse,theextendedrecalldatadonotdeviateagreatdealfromtheone-yearrecalldata,butforallfourtypesofillegalbehavior,thereisa"dipper"effect,withtrendlinesbasedonlong-termrecalldatadippingbelowthetrendlinesfortheone-yearrecalldata.Figure4.1isconsistentwithapatternofincreasedforgettingastheintervaloverwhichtherespondentisaskedtoremembereventsorbehaviorincreases.Theproblemofmemorydecayappearslessseriousforsometypesofillegalbehavior(harddruguse)thanforothers(generalnondrugoffending).MenardandElliottconsideredotherpossibleexplanationsofthispattern,butconcludedthatincreasedmemorydecaywithincreasinglengthoftheintervaloverwhichrespondentsareaskedtoremembereventswasthemostplausibleexplanationforthispattern.Figure4.1.PeriodTrendsBasedonLong-andShort-TermRecallInthecomparisonofprospective(one-yearrecall)andretrospective(10-yearrecall)data,respondentswereaskedwhether(andifso,when)theyhadevercommittedeachofseveralseriousoffenses(rape,robbery,aggravatedassault,gangfighting,burglary,theftof71 华中科技大学硕士学位论文morethan$50,motorvehicletheft,andsaleofharddrugs).Briefly,theprospectiveself-reportsincludedmorethan90%oftheoffensesreportedontheretrospectiveself-reports,buttheretrospectiveself-reportscapturedfewerthanhalfoftheoffensesfoundbytheprospectiveself-reports.Theseresultsarealsoconsistentwiththehypothesisofincreasingmemorydecayforlongerintervals.OtherpossibleexplanationsforthesepatternswereexaminedbyMenardandElliott,butwereagainfoundtobelessplausiblethantheexplanationbasedonfailuretoremembereventsthatoccurredseveralyearsago.Althoughtheseresultsdonotruleouttheuseofretrospectivedataingeneral,itisclearthatforsomebehaviors,long-termretrospectivedataareunreliableandmayproducetrendsoreffectsoppositetothoseindicatedbyprospectivedata.Retrospectiveandprospectivepaneldatashouldnotbeusedinterchangeablyunlessthereisevidencethattheextendedrecallperiodrequiredbyretrospectivedatadoesnotresultinunderestimatesofeventsinearlieryears.Issuesofreplicationandrecallmayalsoincludethephenomenaoftelescopingandreversetelescoping:reportinganeventthathappenedinoneperiodforamoreorlessrecentperiodthantheoneinwhichitoccurred.EvidenceoftelescopinghasbeenfoundintheNationalCrimeSurvey(LehnenandSkogan,1981),andthefirstinterviewforNationalCrimeSurveyrespondentsisnotusedforestimatingratesofvictimizationforthesample.Otherstudiesattempttousememoryboundingtechniques(e.g.,referencetoparticulareventssuchasbirthdaysorholidays)toreducetheimpactoftelescopingandreversetelescoping.ThedatafromtheNationalYouthSurvey(MenardandElliott,1990a)alsoindicatesometelescopingandreversetelescopingwhenretrospectiveandprospectivedataarecompared.Problemsofrespondentrecallareproblemsprimarilyformicrosocialinterviewresearch.Theuseofprospectivepaneldesignshelpstoreducetheseproblems,butnottoeliminatethemaltogether.Retrospectivedesignsmayhaveseriousproblemsofvaliditybecauseasthelengthofthetimeintervalforwhichrespondentsareaskedtoreportevents72 华中科技大学硕士学位论文orbehaviorincreases,sodoesthelikelihoodofmemoryfailure,memoryreconstruction(Weis,1986),andunderreporting.Forsomepurposes,suchasmeasuringchangesinattitudesovertime,onlyprospectivepaneldesignsappeartobeadequate.Finally,cautionshouldbeexercisedwhenusingrepeatedcross-sectionaldesignstomeasurechangeovertime.Evenrelativelyminordifferencesinsamplingproceduresortheadministrationofsurveyinstrumentsmayproduceseriousproblemsforreplication,asMartin"s(1983)examplesindicate.TheCostsofLongitudinalResearchWallandWilliams(1970)suggestedthatthecostsofprospectivepanelstudiesareprobablynohigherperwaveofdatacollectedthanthecostsofasimilarnumberofcross-sectionalstudies.Sixwavesofaprospectivelongitudinalsurveymaycostnomorethansixcross-sectionalstudieswithcomparablepopulationsandsamplesizes.Althoughthismaybetrue,itisimportanttoconsiderwhetheronesix-waveprospectivelongitudinalstudyisworthasmuchasormorethansixseparatecross-sectionalstudies,orworthsixtimesasmuchasaretrospectivepanelstudy.Notalltypesofresearchrequirelongitudinaldata,andsomethatdocouldrelyonsecondaryanalysisoflongitudinaldatathathadalreadybeencollectedbyotherresearchers.Forsomepurposes,longitudinalresearchistheonlyacceptableoption.Ifthepurposeistomeasurehistoricalordevelopmentalchange,alongitudinaldesignisessential,especiallytoseparateage,period,andcohorteffects.Ifchangeistobemeasuredoveralongspanoftime,thenaprospectivepaneldesignortotalpopulationdesignwillusuallybethemostappropriatedesignfortheresearch,becauseindependentsamples(inrepeatedcross-sectionaldesigns)maydifferfromoneanotherunlessbothformalandinformalproceduresforsamplinganddatacollectionarerigidlyreplicatedforeachwaveofdata(Marlin,1983).Also,recallfailuremayrenderinferencesdrawnfromretrospectivepaneldesignsinvalid.Ifchangeistobemeasuredoverarelativelyshorttime(weeksormonths),thenaretrospectivedesignmaybeappropriatefordataoneventsorbehaviors,but73 华中科技大学硕士学位论文probablynotforattitudesorbeliefs.Repeatedcross-sectionaldesignsorrevolvingpaneldesignsmaybeappropriateifaproblemofpanelconditioningasaresultofrepeatedinterviewingorobservationinaprospectivepanelisanticipated.Ifthepurposeoftheresearchistoidentifyorestimatethestrengthofcausalrelationships,longitudinalresearchmayagainbepreferabletocross-sectionalresearch,especiallyifthetruecausalandtemporalorderofchangesinvariablesisunknown.Hypothesesderivedfromtheory,orworse,guessesaboutcorrectcausalandtemporalorderareinadequatesubstitutesforknowledgeaboutcausalandtemporalorder,andtemporalorderisoneaspectofarelationshipthatmustbetestedinordertodeterminewhetheraproposedcausalrelationshipexists.Thebesttestsofcausalrelationshipsinvolvetheuseofexperimentaldesigns(Babbie,1989;Bailey,1987;CampbellandStanley,1963;Williamsonetal.,1982),andexperimentaldesignsareatleastimplicitly,andusuallyexplicitly,prospectivelongitudinaldesigns.Ifthemeasurementofchangeisnotaconcern,ifcausalandtemporalorderareknown,orifthereisnoconcernwithcausalrelationships,thencross-sectionaldataandanalysismaybesufficient.If,however,theresearchproblemrequireslongitudinaldataandanalysis,itmakesmoresensetospendmoremoneytogettherightanswerthantospendlessmoneytogetaninconclusiveanswerthatmaywellbewrong.Undersuchcircumstances,thequestionofwhetherlongitudinalresearchisworththecostdoesnotreallyinvolveaquestionofwhetherlongitudinalorcross-sectionalmethodsshouldbeused;itinvolvesaquestionofwhetherthecostofthelongitudinalresearchisjustifiedbytheimportanceoftheresearchproblemthatisbeingconsidered.Thechoiceshouldbebetweendoingtheresearchproperly,ornotdoingitatall.5.LONGITUDINALANALYSISInChapter2,twoprimarypurposesforlongitudinalresearchweredescribed:thedescriptionofchange,andtheanalysisofcausalrelationships.Thisfinalchapterpresentsabroadoverviewofanalyticalmethodsforaccomplishingthesepurposes.Insodoing,it74 华中科技大学硕士学位论文shiftsfromafocusonlongitudinaldatacollectiontoafocusonlongitudinaldataanalysis,whattodowiththedataoncetheyarecollected.Thevariousmethodsforlongitudinaldataanalysisaredescribedindetailelsewhere,anditisnotthepurposeofthischaptertodemonstratehowtouseeachmethod.Instead,thefocusisonthedifferenttypesofresearchquestionsthatmaybeaddressedbylongitudinalresearchandthedifferentmethodsthatmaybeusedtoanswerthosequestions.Moredetailedexplicationofthemethodsoflongitudinalanalysismaybefoundinthesourcescitedinconnectionwiththerespectivemethods.ConceptualizingandMeasuringChangeThemostfundamentaltaskforlongitudinalresearchmayalsobethemostdifficult.First,adistinctionneedstobemadebetweenqualitativeandquantitativechange.Themeasurementofqualitativechangeisstraightforward:Eitherthereisachangeinthevalueofthevariable(e.g.,inqualitativestates),orthereisnot.Forexample,oneeithermovesfrombeinganondelinquent(nodelinquentactivity)tobeingadelinquent(somedelinquentactivity),oroneremainsanondelinquent.Onemovesfrombeingablue-collarworkertobeingawhite-collarworker,oroneremainsablue-collarworker.Foreachseparatecategoryofeachvariable,thepatternisthesame:Oneeitherchangesoronedoesnot.Measurementofpurelyqualitativechangemaythusinvolveasimpleyes-nodichotomy.Ifcategoriesareordinalandfewinnumber,thedichotomousmeasurementofchangeisadequate,butforordinalscaleswithmanycategoriesamoredetailed,quantitativemeasureofchangemaybefeasibleordesirable.Moreextensivespecificationofhowacasehaschangedmaybedesirable(e.g.,forthenominalscale"religion,"wemaywanttoknowwhetheroneconvertedfromProtestantismtoRomanCatholicismortoJudaism),butinprinciplethisjustmeansconstructingasetofcategoriesbasedondifferentdichotomouspossibilitiesofchange(oneforeachstateattime1andoneforeachcorrespondingstateattime2).Whethertherehasbeenanychangeisstilladichotomousmeasure.75 华中科技大学硕士学位论文Forcontinuousmeasurementscales,twomeasuresofchangearecommonlyconsidered.Oneisthedifferencebetweenthelaterscoreandtheearlierscoreonavariableasdefinedbysubtraction:X2-X1,wherethesubscriptsrefertotimeperiods.Thismaybecalledadifference,achangescore,arawchange,orarawgain.Asecondmeasurethathasbeenusedinresearchonchangeistheresidualgain.Inordertocalculatearesidualgain,thevariableY2isfirstregressed(usinglinearregression)onY1inordertoobtainapredictedorexpectedvalueforY2.TheexpectedvalueofY2,E(Y2),dependsonthevalueofY1andthevaluesoftwoparameters,a(theintercept;theexpectedvalueofY2whenY1iszero)andb(theslopeofthebestfittinglinefordescribingtherelationshipbetweenY2andY1):E(Y2)=a+bY1.TheresidualgainscoreisthedifferencebetweentheactualvalueofY2andtheexpectedorpredictedvalueofY2:Residualgain(Y)=Y2-E(Y2)=Y2-a–bY1Forratioscales,thereisathirdcommonlyusedmeasureofchange.ThepercentchangeinZis:Percentchange(Z)=100%(Z2–Z1)/Z1.Notethatthismeasureisnotappropriateforusewithanythingotherthanaratioscalebecauseforanyscalewithoutanonarbitraryzeropoint,thereexistsaninfinitenumberofdifferentbutequallyvalidmeasuresofpercentchange.Toillustratethispoint,considertemperatureasanexample.Onthisintervalscale,thepercentchangefromroomtemperaturetotheboilingpointofwateris100%(212-70)170=203%fortheFahrenheitscale,butfortheCelsiusscaleitis100%(100-21)/21=376%.Variationsonthismeasureofchangeincludetheaverageannualpercentagegrowth(orchange),andmeasuresbasedonratesotherthanpercentages(e.g.,ratesper1,000orper100,000).Anothermeasureofchangeforratioscalesisthecompoundrateofchange,themostfamiliarexampleofwhichisthecompoundingofinterestinasavingaccount.Anymeasureofchangemaybeusedovermorethanoneunitoftime.Onesimplydividesthechangebythenumberofperiods(orotherunitsoftime,notnecessarilyequalinlengthtotheperiodsusedformeasurement)overwhichthechangeoccursinorderto76 华中科技大学硕士学位论文obtainarawgain,residualgain,orpercentchangeperunittime.Fordescriptivepurposes,theselectionofonemeasureofquantitativechangeoveranothermaybelargelyamatteroftaste,exceptthatresidualgainscoresshouldbeusedtoidentifythosecasesthat,givensomeinitiallevelorvalueonthevariablewhosechangeisbeingdescribed,changedmoreorlessthanwouldbeexpected.MeasuringChangetoAnalyzeChange.Measuringchangeforthepurposeofanalyzing,predicting,orexplainingchange(e.g.,inacausalmodel)ismoreproblematicthanmeasuringchangefordescriptivepurposes.Thereissomedisagreementinthesocialandbehavioralscienceliteratureabouttheappropriatenessofrawgainscoresasmeasuresofchangewhenthepurposeistoanalyzechange.CronbachandFurby(1970)arguedagainsttheuseofrawgainscoresbecauserawgainscoresaresystematicallyrelatedtoanyrandomerrorofmeasurement,4aretypicallylessreliablethanthescoresofthevariables(e.g.,XIandX2)fromwhichtheyarecalculated,andtheunreliabilityofrawgainscoresmayleadtofallaciousconclusionsorfalseinferences.Theyalsoarguedagainsttheuseofresidualgainscoresaschangevariables(forsimilarreasons),andsuggestedthatresidualgainscoresbeusedonly(asamoreappropriatealternativetogainscoresforthispurpose)toidentifycasesthatchangedmoreorlessthanexpectedbasedontheirinitialscores.Plewis(1985)concurredandobservedthattheproblemofmeasurementerrorisjustasseriousforresidualgainscoresasforrawgainscores.Asanalternativetomodelsthatuserawgainorresidualgainscores,modelswithlaggedendogenousvariableshavebeensuggestedbytheseandotherauthors(KesslerandGreenberg,1981).AqualifieddissentisofferedbyLikeretal.(1985).Theydemonstratethatfirstdifferenceequationsthatinvolvetheuseofrawgainscoresmaybesuperiortobothcross-sectionalequationsandtheuseoflaggedendogenousvariablesforlinearmodelsinwhich(a)regressionparametersremainconstantfromoneperiodtoanother,(b)thereareunmeasuredvariablesthatinfluencethedependentvariablebutdonotchangeovertime,77 华中科技大学硕士学位论文(c)thereisautocorrelatederrorinthemeasurementofthosevariablesthatbothinfluencethedependentvariableandvaryovertime,and(d)thepaneldatagivemorereliablemeasurementofchangesinpredictorvariablesovertimethanofthelevelorvalueofpredictorvariablesatanygiventime.Firstdifferenceequationsareformedbytakingtwocross-sectionalequations,onefortimetandonefortimet+1,andsubtractingtheearlierfromthelaterequation.Allvariablesintheequationarethenexpressedasdifferences.Notethattheconditionsunderwhichfirstdifferenceequationsarepreferabletoothermethodsofanalysisarequiterestrictive.Theconditionthatchangeinavariablebemeasuredmoreaccuratelythanthelevelofavariable,inparticular,almostbegsthequestionsraisedbyCronbachandFurby(1970),whomakethepointthatitistypicallynotthecasethatchangeinavariableismeasuredmorereliablythanlevelofavariable.BaltesandNesselroade(1979)suggestedthat"theproblemssooftencitedwithinthecontextofmeasuringchangeseemtoarisefromuncertaintyconcerninghowchangeshouldbedefinedandfromtheuseofmeasurementandscalingprocedureswhosepropertiespromptlittlefaithinthevalidityofderivedmeasures,suchaschangescores."Plewis(1985)qualifiedhisownreservationsaboutdifferencescoresbysuggestingthattheymaybeappropriateforsomeeconomicdata,whichhesuggestedmightbemeasuredmoreaccuratelythandataintheothersocialsciences.BaltesandNesselroadealsoobservedthatitmaybeimpracticabletoavoidaltogethertheuseofdifferencescores,especiallyinappliedresearchthatusesapretest-posttestdesigntoestimatetheeffectsofatreatmentorintervention.Theconclusiontobedrawnfromallofthisisthatthedecisiontouseanysortofmeasureofchangeinananalysisofchangeisnotasimpleissue,andmaydependonthetheoreticaljustificationforusingachangemeasure(CronbachandFurbysuggestedthatsuchjustificationrarelyexists),thereliabilityofchangemeasuresascomparedwiththereliabilityofmeasurementofthevariablesfromwhichthechangemeasuresarederived,andthepresumedspecificationoftherelationshipamongthevariablesinthemodel(LikeretaI.,1985).78 华中科技大学硕士学位论文OtherIssuesintheMeasurementofChange.Anyofthechangemeasuresdescribedabovemaybeusedforeitherindividualcasesorforgroupsofcases(e.g.,malesandfemales;moredevelopedandlessdevelopedcountries)intotalpopulationdesigns,paneldesigns,and(forsomecasesoveralimitedspanoftime)revolvingpaneldesigns.Inrepeatedcross-sectionaldesigns,measurementofchangeforindividualcasesisnotreallypossible,butchangemaybemeasuredforwell-definedgroupsofcasesaslongasthecasesarecomparableatthegrouplevelfromonecrosssectiontothenext.Forprobabilitysamplesofthepopulationwithadequatenumbersofcasesineachgroup,thisshouldposelittleproblemaslongassamplingandtheadministrationofthedatacollectionarestrictlyreplicated,butanydeviationfromtheoriginalsamplingoradministrationproceduresmayseriouslycompromisethecomparabilityofthedataandmayrendertherepeatedcross-sectionaldatauselessforlongitudinalanalysis(Martin,1983).AllofthelongitudinaldesignsdescribedinFigure3.2maybeusedtomeasurechangeforthefullsampleorpopulation,butagainwithrepeatedcross-sectionaldesignscaremustbetakentobesurethatthesamplingandadministrativeproceduresarethesamefordifferentcrosssections.Wheneverweattempttomeasurechange,weneedtoconsiderwhetherapparentdifferencesfromonetimetoanotherreallyindicatechange,orwhethertheymayindicateunreliabilityofmeasurementinstead.Previouslycitedexamplesillustratethisproblem.WerethedifferentconclusionsofRedfield(1930)andLewis(1951)inTepoztlan,Mexico,theresultofunreliability(oneorbothoftheobserverswerebiasedandgaveaninaccurateaccountoflifeinthevillage)ordidthevillagechangesubstantiallyinthetimefromRedfield"sobservationtothetimewhenLewisconductedhisresearch?DoesthenegativeassociationbetweennumberoftimesinterviewedandnumberofvictimizationincidentsreportedintheNationalCrimeSurvey(Cantor,1989)reflectunreliabilityintheNationalCrimeSurveydata,arealdecline(possiblytheresultofa"treatment"effectinwhichrespondingtothesurveyprovokesrespondentstothinkabouttheirvictimization79 华中科技大学硕士学位论文experiencesmoredeeply,andtotakeprecautionstoavoidvictimization),asamplingproblem(arethosewiththehighestratesofvictimizationdisproportionatelylikelytochangehouseholdsandthustoleavethesample?),orarealperiodtrendinvictimization?Thecharacteristicsofthesamplewithrespecttolengthoftimeinthesamplepresumablywouldhavestabilizedin1976(i.e.,thenumberofrespondentsorhouseholdsthathadbeeninterviewedonce,twice,threetimes,andsoforthwouldbeexpectedtoremainthesameafterthefirstthreeyearsbecausethesamplerevolvesonathree-yearcycle),andestimatedvictimizationratesformostoffenseshavedeclinedintheNCSpanelsince1976(U.S.DepartmentofJustice,1988,1989).Itisthuspossiblethatsomeofthedeclineinvictimizationratesmeasuredonrepeatedinterviewsisattributabletorealperiodtrendsinvictimization,butitisunlikelythatperiodtrendscanexplainalloftheobservedchange(Cantor,1989).Interestingly,itispossiblethattrendsinvictimizationaremeasuredmoreaccuratelythanlevelsofvictimizationbecausesince1976theNationalCrimeSurveyhasprobablyhadthesamedistributionofsystematicerrorwithinthesample;ifso,thiswouldsatisfyoneoftheconditionssuggestedbyLikeretal.(1985)foruseoffirstdifferenceratherthanlaggedendogenousmodelstoanalyzevictimization.Recallthattest-retestreliabilitymeasures(butnotinternalconsistencyreliabilitymeasures)arethemselvesmeasuresofchangewhenitisassumedthatnochangehasactuallyoccurred(ZellerandCarmines,1980).Thedilemmaofseparatingunreliabilityofmeasurementfromrealchangemaybestbeaddressedbyreplicationandtheuseofmultiple,independentmeasuresofreliabilityandchange.Insomeinstances,otherevidencemayclearlyfavoroneexplanation(e.g.,reliability)overtheother(e.g.,change).Forexample,changesinprevalenceofillegalbehaviormaybesimilaracrossagegroupsinanage-specificanalysis,andthesechangesmaybeindependentofthenumberofpreviousinterviews;thiswouldsuggestrealchangeinsteadofunreliability.Ifchangesvariedacrossagegroupsinawaythatappearedtobelinkedwiththenumberofpreviousinterviews,astrongercasecouldbemadeforunreliability.80 华中科技大学硕士学位论文DescribingPatternsofChangeThedescriptionofapatternofchangemaytypicallytakeoneofthreeforms:numerical,graphical,ormathematical(includingstatistical).Numericaldescriptionsofchangesimplyinvolvethepresentationofthenumericalvalueofsomemeasureofchange,forexample,theannualpercentagechangeinthepercapitagrossnationalproduct.Graphicaldescriptionsofchangegenerallyinvolveplottingvaluesofavariablefordifferentperiodsonagraphonwhichtimeisthehorizontalaxisandthevariableisontheverticalaxis.Figure4.1isanexampleofagraphicaldepictionofchangeandindicateswhethertrendsareupward,downward,orstableforanygiventimeinterval,andwhetherandhowtrendschangeovertime.Patternsofchangeinquantitativevariablesmaybedescribedmathematicallybydeterministicorprobabilisticmodels.Indeterministicmodels,changeisconceptualizedasfollowingsomefixedpatternorlaw.Knowinghowthevaluesofsomerelevant,finitesetofpredictorvariableschangeforaspecificcasepermitsustoknowwithcertaintywhetherthevalueofapredictedordependentvariableforthatcasewillchange,howitwillchange(increaseordecrease),andbyhowmuchitwillchange.Inpractice,inthesocialsciences,thereislikelytobesomedeviationfrompredictionsofdeterministicmodels,ifonlyasaresultofmeasurementerror,butinprinciplewecanknowexactlywhether,how,andbyhowmuchonevariablechangesinresponsetochangesinothervariables,forindividualcases,groups(e.g.,malesandfemalesormoreandlessdevelopedcountries),orforanentiresampleorpopulationofcases.Inprobabilisticmodels,ifweknowhowthevaluesofsomesetofpredictorvariableschangeforthetotalpopulation,thesample,oragroupofsufficientsize(malesandfemales,moreandlessdevelopedcountries),wecanpredictwithsomeaccuracytheproportionorpercentageofcasesthatwillchange,theproportionorpercentagethatwillchangeinacertainway,andtheaverage(mean,median,modal)amountbywhichtheywillchange.(Thisisanalogoustothesituationinthephysicalscienceswithquantum81 华中科技大学硕士学位论文mechanics;seenote2.)Thisisbecausetheunderlyingassumptioninprobabilisticmodelsisthatthereissomeinfluenceorsetofinfluencesonbehaviorthat,ontheindividualcaselevel,operatesasaprobabilisticprocess.Caseswithcertaincharacteristicsmaybemoreorlesslikelythancaseswithothercharacteristicstochangeinaspecifiedway,butindividualcasesneednotbeconsistentintheirpatternsofchangewithothercasesinthegrouporsample.Onewayofviewingthispatternistothinkofindividualsashavingvariousinfluencesontheirbehavior(strongerinfluencesinaparticulardirectionforsomeindividualsorgroups,weakerinfluencesforothers),butatthesametimeashavingsomefreedomtochooseamongdifferentpatternsofbehavior,andeventoresiststronginfluencesinaparticulardirection.Someindividualswillchoosetoresistthemeasurableinfluencesontheirbehavior,evenifthoseinfluencesarestrong,butasmallerpercentageofcaseswillresistastronginfluencethanwillresistaweakinfluence(implyingasmallererrorofpredictionforastronginfluence).UnivariateModelsofQuantitativeChange.Deterministicunivariatemodelsofchangeinquantitativevariablesinthesocialsciencesincludefunctionalequations(KimandRoush,1980:101-104),differenceequations(HuckfeldtetaI.,1982;KimandRoush,1980,Chapter5),anddifferentialequationmodels(Blalock,1969:88-91;KimandRoush,1980,Chapter6).Allofthesemodelsexpressthevaluesofthevariableinwhichchangeisbeingdescribedasfunctionsoftime.Descriptionsofchangeinavariableshouldincludeonlythatvariableandtimeinthemathematicalformula;explanationsofchangeinvolvetheintroductionofothervariablesintotheequation.Anexampleofadeterministicmodelofchangeistheinternal-influencediffusionmodel(MahajanandPeterson,1985).Simplemodelsofthediffusionofaninnovationsuchastheinternal-influencediffusionmodeltypicallyexpressthecumulativenumberofadoptersofaninnovationatagiventimeasafunctionoftime,expressibleintheformadifferentialequation(Hamblinetal.,1973;MahajanandPeterson,1985).Onepossible82 华中科技大学硕士学位论文equationfordescribingthisprocessiswhereXisthecumulativenumberwhohaveadoptedaninnovation,dX/dtistherateofchangeinX,tistimemeasuredinsomeappropriateunit,andnandcareconstantparametersthatneedtobeestimated.Ifweintegratetheequation,itmaybewrittenequivalentlyasInitssimplestform,ifn=0,theequationbecomesX=ct;Xisexpressedasalinearfunctionoftime,andtheconstantcmaybeestimatedbyusingordinaryleast-squaresregressiontechniques.Thisapproach,orvariationswithpolynomialfunctionsoft,maybeusefulfordescribingchangewhenthenumberofcasesisrelativelylarge(e.g.,morethan20)andthenumberofmeasurementperiodsisrelativelysmall.Thiscontrastswithtime-seriesanalysis(BoxandJenkins,1970;McClearyandHay,1980),inwhichthenumberofcasesisusuallysmall(typicallyonecase)andthenumberofmeasurementperiodsistypicallylarge(preferablygreaterthan50).Time-seriesanalysisisaprobabilisticmethodfordescribingchangeinquantitativevariablesthathasbecomeincreasinglypopularinthesocialsciences,especiallysincethepublicationofBoxandJenkins(1970).Timeseriesanalysisattemptstodescribelongseriesoftime-ordereddataintermsofsomecombinationoffourprocesses.Awhitenoiseprocessisaseriesofrandomshocksorchanges;thisistheprobabilisticcomponentthatispresentinallstochastictime-seriesmodels.Anautoregressive(AR)processisoneinwhichthepresentvaluesofavariabledependonpastvaluesofthatsamevariableatsomespecifiedlag(s)orinterval(s).Amovingaverage(MA)processisoneinwhichpastvaluesofthewhitenoiseprocesscontinuetoinfluencepresentvaluesofthemodeledvariableforsomefinite,specifiedlag(s)orinterval(s).Anintegrated(I)processisoneinwhichthereisadetectabletrendordriftovertimeinthevaluesofthemodeledvariable,butinwhichthereisnotrendordriftintheseriesthatresultsfromsubtractingvaluesofthevariablefromvaluesofthevariableatsomelatertime.Thepurposeofsubtractingordifferencingistoobtainastationarywhitenoisetimeseries,oneinwhichthevalueofthewhitenoise83 华中科技大学硕士学位论文processhasameanofzero(thatis,thevalueoftherandomcomponentoftheseriesatonetimeisuncorrelatedwiththevalueofthatseriesatanothertimeforanyspecifiedtimeinterval).Atime-seriesanalysismayincorporateone,two,orallthreeoftheprocessesinadditiontothewhitenoiseprocessinordertoobtainastationarytimeseries,andtodescribehowavariablechangesovertime.Time-seriesanalysishaslongbeenusedineconomicanalysisandforecasting,andVigderhous(1977)hasappliedtime-seriesanalysistothestudyofsuicide.UnivariateModelsofQualitativeChange.Univariatemodelsofchangeforqualitativedatausestage-stateanalysesordynamictypologies,classificationsintofinitesetsofcategoriessuchthatacasemaymovefromonecategorytoanotherovertime.Stage-statemodelsofunivariatechangeareconcernedwiththeprobabilityofmovingfromonevalue(state)toanothervalueofavariablebyagivenperiod(stage).Formultiplecategoryormultivalentcategoricalvariables,separateprobabilitiesoftransition(movementfromonevaluetoanotherinagivenintervalbetweenperiods)arecalculatedforeachpairoforigin(thestateorvalueatthebeginningoftheinterval)anddestination(thestateorvalueattheendoftheinterval)states,includingthoseinstanceswhentheoriginstateisthesameasthedestinationstate.Whentheoriginandthedestinationarethesame,thetransitionprobabilityindicatesthestabilityofmembershipinthatstateoverthespecifiedinterval.Univariatestage-statemodelsofchangeinthesocialsciencesarecharacteristicallyprobabilistic,notdeterministic.Stage-statetransitionsmaybedescribedusingsimpletransitionmatrices,withnoassumptionsaboutunderlyingpropertiesofthetransitionmatrices(Elliottetal.,1989:179),Markovmodels,includingMarkovchains(Bartholomew,1973;Markus,1979),log-linearmodels(Hout,1983),univariatelifetablemodels(NamboodiriandSuchindran,1987),orunivariatesurvivalorhazardmodels(Allison,1984;BlossfeldetaI.,1989).Lifetablemodelsandsurvivalorhazardmodelsaregenerallybasedonmeasurementstakenforseveralperiods(usuallymorethan10,occasionallyasfewas5).Theothermodelsmaybebasedonasfewastwoperiods.84 华中科技大学硕士学位论文Elliottetal.(1989)usedtransitionmatricestomodeltransitionsfromnondelinquencytoincreasinglevelsofdelinquencyanddruguseinadolescence.Theyusedfivestages(1976-1980)andfourstates(nonoffenders,exploratoryoffenders,patternednonseriousoffenders,andseriousoffendersfordelinquency;nonusers,alcoholusers,marijuanausers,andpolydrugusersfordruguse).Transitionmatricesfordelinquencywerehomogeneous;theyvariedfromoneperiodtoanothernomorethanwouldbeexpectedbasedonrandomerror,basedonachi-squaretestdescribedinMarkus(1979).ThedelinquencymatricesforadolescenceapproximatedastationaryMarkovprocess.Fordruguse,thetransitionmatriceswerestatisticallysignificantlydifferentfromoneperiodtothenext,ornonhomogeneous,primarilybecausepatternsoftransitiontohigherlevelsordrugusebecomemorelikelyinlateradolescencethantheyareinearlieradolescence.Elliottetal.usedthesetransitionmatricesaspartofalargeranalysistodescribedevelopmentalpatternsinillegalbehavior.Theyalsousedtransitionmatricestoexaminetheonsetorinitiationandthesuspensionofdifferenttypesofillegalbehavior.Transitionmatrices,includingthoseinvolvingMarkovmodelsandloglinearmodels,arebasedonsimplerowpercentagesfromcross-tabulationsorcontingencytablesthatcomparethevaluesofavariableatonetime(thecolumnvariable)forthesamesetofcases.IntheElliottetal.(1989)example,itwaspossibletomoveintooroutofeachstate.Insomemodels,thereexistabsorbingstatesthat,onceentered,cannotbeleft.Themostcommonexampleofanabsorbingstateisdeath.ForhomogeneousMarkovprocesseswithatleastoneabsorbingstate,everycasewilleventuallyenteranabsorbingstate,anditispossibletocalculate(a)whatproportionofcaseswillbeintheabsorbingstate(s),andeachotherstate,atagivenperiod,and(b)howlongitwilltakeallcases,oracertainproportionofcases,toentertheabsorbingstate(s).Lifetablemodelscanbeusedtoperformsimilarcalculations.Univariatehazardandsurvivalmodelsaresimilartolifetablemodels,butassumethatthehazardorsurvivalratefollowssomefixeddistribution.Exceptforproportionalhazardsmodels,thatdistributionisassumedtobeknown,andthe85 华中科技大学硕士学位论文modelmaybetestedtoseehowwellthedatafittheassumeddistribution.Survivalmodelshavebeenusedtomodelrecidivism(SchmidtandWitte,1988),laborforceparticipation(B1ossfeldetal.,1989),maritalhistoryevents(Peters,1988),andothereventsthatinvolvetransitionsamongdiscretestates.TemporalandCausalOrderEarlier,Ilistedthefundamentalrequirementsforestablishingtheexistenceofacausalrelationship:covariation,temporalprecedence,andnonspuriousness.Twoapproachestotheissueofcausalandtemporalorderareconsideredhere:stage-stateanalysisandtemporalorderofmeasurement.Whenvariablescanbecodedtoindicatewhetherapresumedcausalvariableorapresumeddependent(effect)variablehaschanged,stage-stateanalysismaybeusedtoindicatethetemporalorderofthosechanges.Thesechangesmaybemeasuredassimpledichotomies(yes,changehasoccurred,orno,changehasnotoccurred).Oneimportanttypeofchangeistheonsetorinitiationofaparticularstateortypeofbehavior.Thisreferstothefirsttimethatacaseentersaparticularstateor,correspondingly,thefirsttimethatanindividualengagesinaparticulartypeofbehavior.Otherpossiblechangesincludeescalationofbehavior(entryofahigherstateonanordinalscale),de-escalationorreduction(entryofalowerstateonanordinalscale),andthesuspensionofbehavior(permanentortemporaryexitfromallstatesthatindicateinvolvementinaparticularkindofbehavior).ResearchontheNationalYouthSurvey(Elliottetal.,1989;Huizingaetal.,1989;MenardandElliott,1990a)hasusedstage-stateanalysistoexaminetheonset,escalation,andsuspensionofillegalbehavior;theonsetofdruguseandothernormsorillegalbehavior;andtheonsetofillegalbehaviorandofcausalvariables(involvementwithdelinquentfriends,weakeningofbeliefsunfavorabletoillegalbehavior)thoughttocauseillegalbehavior.Thesestage-statemodelsprovidedevidenceonsomelong-standingcontroversiesincriminology.Anexampleistherelationshipbetweendruguseandother86 华中科技大学硕士学位论文formsofillegalbehavior.Threehypothesessuggestedbycriminologistshavebeenthat(a)druguseleadstoothertypesofbehavior,(b)othertypesofillegalbehaviorleadtodruguse,and(c)bothdruguseandcrimeareeffectsofthesamesetofcauses(e.g.,weakbeliefsinconventionalmorality,involvementwithdelinquentorcriminalfriends).Huizingaetal.(1989)codedeachbehaviorsothatineachperiodeachrespondentwasclassifiedaseitherneverhavinginitiatedthatbehaviororasever(evenifnotcurrentlyactive)havinginitiatedthatbehavior.Everhavinginitiatedonebehavior,coupledatsometimewithneverhavinginitiatedtheother,wascountedasacaseinwhichtheonebehaviorwastemporallypriortotheother.Huizingaetal.foundthattheonsetofdruguse(includingalcoholuse)typicallyfollowedtheonsetofothertypesofillegalbehavior(evidenceagainstthehypothesisthatdruguse,atleastinitially,leadstoothertypesofcrime),butalsofoundthatheavydruguseappearstoinhibitsuspensionofseriousillegalbehavior.Itthusappearsthatdruguseisnotimplicatedasacauseoftheonsetofillegalbehavior,butitmaybeacauseofcontinuationofillegalbehavior.Stage-stateanalysismaynotalwaysbeafeasibleapproachtotheexaminationoftemporalorcausalorder.Insomeinstances,theprocessorrelationshipbeinginvestigatedhasbeenongoingforalongtime,anditisnotpossibletocollectdataononset.Thisisaproblemofleft-handcensoring,thefailuretodetectwhenachangehasoccurredbecauseithappenedbeforethefirstperiodforwhichdatawerecollected.Alternatively,thevariablesbeinganalyzedmayhavenomeaningfulonsetorsuspension.Incross-nationalmodels,forexample,nonationeverhas"zero"economicproductionor"zero"mortalityorfertilityatanyperiodinitsexistence.Thesearecharacteristicsofanationthatpersistthroughtime,andonecannotestablishcausalortemporalorderbyaskingwhichstartedfirst.Changesinbothvariablestakeplacefromoneperiodtothenext,andstage-statemodelscannotdisentanglewhichiscauseandwhichiseffect.Asexplainedearlier(seeFigure3.1),simplymeasuringonevariableforanearlierperiodandtheothervariableforalaterperioddoesnotestablishthefirstasacauseofthesecond.Linearpanelanalysis87 华中科技大学硕士学位论文(KesslerandGreenberg,1981;Markus,1979)maybeusedtohelpdisentanglecausalorderinstudiesthatinvolvevariablesforwhichthereisnomeaningfulonset,andthatarenotamenabletostage-stateanalysis.Forexample,Menard(1990)usedatwo-wavepanelmodeltoexaminetherelationshipamongfertility,mortality,andseveralindicatorsofsocialandeconomicdevelopment.Consistentwithdemographictransitiontheory,Menardfoundthatmortalityhadasubstantialpositiveinfluenceonfertility.ConsistentwithMalthusianandclassicaleconomictheory,apositiveeffectofeconomicprosperity(asmeasuredatthenationallevelbypercapitagrossnationalproduct)wasalsofound,butthiseffectwassmall.InconsistentwithbothMarxianandMalthusiantheories,fertilityappearedtohavenoeffect,directorindirect,oneconomicprosperityormortality.Theuseoflinearpanelanalysiswithlaggedendogenousvariableshelpedseparatewhichvariableshadeffectsonwhichothersinthefaceoftheoreticaldisagreementsaboutcausalordering.Twoimportantqualificationsmustbenotedabouttheuseoflinearpanelmodelsfordisentanglingcausalorder.First,thelagtime(theintervalbetweenperiods)mustbeadequatetoallowchangeinonevariabletobeclearlyseparatedfromchangeinanother.Thisqualificationappliestostage-statemodelsaswell.Ifthechangeinbothvariablesoccursinthesamemeasurementperiod,itispossiblethat(a)thetwovariablesarereallymeasuringthesamething;(b)thetwovariablesarespuriouslyrelated,andtheircommoncausesproducechangesinbothvariablesatthesametime;andmostlikelyofall(c)themeasurementperiodistoolong,andreducingthelengthofthemeasurementperiodwouldallowustotemporallyseparatethetwochanges.Second,inlinearpanelmodels,thelagbetweenmeasurementperiodsmustcorrespondtothetimeittakesforthecausetoproduceaneffect.Thissecondcriterionforcausallagtimesisnotcriticalifvariableshaveverystablevaluesovertime,butforvariablesthatfluctuateconsiderablyfromoneperiodtoanother,misspecificationofthetemporallagbetweencauseandeffectmayleadtoincorrectinferencesaboutthecausalorderofthecross-sectionalvariablesor,evenmorelikely,aboutthestrengthoftherelationshipbetweenthetwo.Forexample,ifthespecified88 华中科技大学硕士学位论文lagistooshort,astrongrelationshipmayappeartobeweakbecausethefulleffectofchangesinthecausalvariablehasnotyetbeenreflectedinthedependentvariable.Anotherissueintheuseofstage-stateorlinearpanelmodelsistheuseofpointandintervalmeasures,Apointmeasureisonethatisobtainedforasinglepointintime(forexample,thedayonwhichtheinterviewoccurs).Attitudinalmeasuresaretypicallypointmeasures.Anintervalmeasureinvolvesacountofevents,orafrequency,measuredforanextendedintervaloftime(forexample,theyearprecedingtheinterview).Manymeasuresofbehavior,especiallyoffrequency(howmanytimes)andtimespan(forhowlongaperiod),areintervalmeasures.(Thisshouldnotbeconfusedwithintervalscales,whicharescaleswithcertainmeasurementproperties;intervalmeasuresaredefinedintermsoftheamountoftimeoverwhichthemeasurementistaken.)Thefactthatapointmeasureisaskedonlyforaveryshortspanoftime(rightnow)andanintervalmeasureisaskedforaverylongspanoftime(alloflastyear)doesnotmeanthatthepointmeasureisvalidfortheentireyearforwhichitismeasured.Itisentirelypossible,forexample,thatmoralbeliefsmeasuredonthedayoftheinterviewhavebeenstableforthepast10months(beforewhichtimetheychangedfromstrongertoweaker)andthatmarijuanausereportedforthepreviousyearalloccurredwithinthepast8months(priortowhichtherewasnomarijuanausebytherespondent).Eventhoughthetimesforwhichthemeasurementsweretakenmightindicatethatmarijuanausechangedbeforebeliefs,thetruetemporal(andcausal,ifotherconditionsaremet)orderinthisexamplewouldbethatthechangeinbeliefprecededthechangeinmarijuanause.Ifbothstage-stateandlinearpanelanalysesarepossible,theresultsmaybecomplementaryandmayhelpuncovercomplex,interactive,orreciprocalrelationshipsthatwouldbeundiscoveredwithoutathoroughanalysisoftemporalorder.Whentherearestrongtheoreticalreasonsforbelievingthatacertaincausalrelationshipexists,onetestofthetheoryistoverifytheexistenceofthehypothesizedtemporalorder.Whencompetingtheoriespositdifferentandconflictingcausalorderings,analysisoftemporalordermay89 华中科技大学硕士学位论文provideastrongtest(Platt,1964)ofcompetingtheories.GrangerCausality.AnotherapproachthattestsforbothcausaldirectionandstrengthofcausalinfluencewasproposedbyGranger(1969).FortwovariablesX1andYt,bothofwhichcanbeexpressedasstationarytimeserieswithzeromeans,whereetandftaretakentobetwouncorrelatedwhitenoiseseries,andmisgreaterthanzerobutlessthanthelengthofthetimeseries.AccordingtothecriterionofGrangercausality,YcausesXifsomebjdoesnotequalzero(implicitly,bjmustbestatisticallysignificantlydifferentfromzero).Correspondingly,XcausesYifsomecjisnotequaltozero.Ineffect,thequestionposedbythetestforGrangercausalitybecomes,"Istherevariationinonevariablethatcannotbeexplainedbypastvaluesofthatvariable,butcanbeexplainedbypastvaluesofanothervariable?"Iftheanswerisyes,thenthesecondvariable"Granger-causes"thefirst.Noticethatifm=1,andifthereareonlytwoperiodsintheseries,thetestforGrangercausalityreducestoatestforthestatisticalsignificanceofthecoefficientsofexogenousvariables(allmeasuredattime1)ontheendogenousvariable(measuredattime2)whenthelaggedendogenousvariable(measuredattime1)isincludedintheequation.Inotherwords,Y2ismodeledasafunctionofY1andX1(andtheremaybemorethanoneXvariablemeasuredattime1).Instantaneouseffects(e.g.,fromX2toY2)areexcludedfromthemodel.Thisamountstoatwo-wavepanelmodelwithnoinstantaneouseffects,likethatusedbyMenard(1990)intheanalysisoffertility,mortality,familyplanning,anddevelopment.Thechoiceofmisarbitrarywithinthelimitsimposedbythelengthofthetimeseries.BarnardandKrautmann(1988)usedasinglelaggedendogenousvariable(Yt-1)withXmeasuredatthreeperiods(Xt-1,Xt-2,andXt-3).Sims(1972)usedlagsoflength8,andalsoused"futurelags"(ineffectallowingfuturevaluesofYtoinfluencethecurrentvalueofY).TobeacauseofYinSims"smodel,XmustexplainvariationinYthatisunexplainedbybothpastandfuturevaluesofY.Wright(1989)separatelyanalyzedlagsof90 华中科技大学硕士学位论文1,2,3,4,and5fortheendogenousvariable.Thereissomeinconsistencyintheresultsfordifferentlagswhenthisapproachistaken.Forexample,Grangercausalitymaybeconfirmedatlagsof3and4,butnotatlagsof1,2,or5.Howarewetointerpretsuchresults?Ingeneral,themorepriorvaluesoftheendogenousvariableareintheequation,thegreateristhelikelihoodofrejectingthehypothesisofGrangercausality,buttheinclusionofadditionalvaluesoftheendogenousvariablemayhavenosignificanteffectbeyondsomenumber.Thisnumbermaybeestimatedbymodelingtheendogenousvariableasanautoregressivetimeseries,orbycalculatingseparateordinaryleast-squaresregressionmodelsandexaminingthechangeintheexplainedvariance(R2)producedbytheinclusionofeachadditionallaggedendogenousvariable(e.g.,bytheadditionofYi-4).lfthereisnostatisticallysignificantchangeintheexplainedvariance(see,e.g.,thetestsuggestedinAgrestiandFinlay,1986:372-375),therewouldseemtobelittlepointinincludingthistermintheequation.Itmaywellbethatalagof1issufficientbothtoexplainthevarianceinthedependentvariableandtorejectthehypothesisofGrangercausality.Ifso,theremaybelittlepointinproceedingbeyondlag1.ItispossiblethatXtandYtwillnotbestationarytimeseries.WithoutsufficientmeasurementsforARIMAtime-seriesanalysis,itmaynotbepossibletodeterminewhethertheconditionsforapplyingtheGrangertesthavebeenmet.Thereseemtobeamplepossibilitiesformisusingthetest,andtheassumptionofstationarityshouldnotbetakenforgranted.Cautionshouldbetaken,particularlywhenapplyingthetesttodataforwhichtheusualARIMAtime-seriesmethodsarenotapplicable.Cross-SectionalDataandCausalOrder.Methodshavebeendevelopedtoattempttoresolvetheissueofcausalorderwhenonlycross-sectionaldataareavailable.Simon(1954),Lazarsfeld(1955),andBlalock(1962)haveproposedtheuseofpartialcorrelationtechniquestotestassumptionsaboutcausalorder.Thesemethodscan,inprinciple,beextendedtoincludehypothesesaboutmultipleregressioncoefficients(VandeGeer,1971)91 华中科技大学硕士学位论文incross-sectionaldata.Theydependontheelimination,apriori,basedontheory,ofcausalrelationshipsincertaindirectionsbetweencertainvariables.Theyareincapableofresolvingtheissueoftemporalorder,andtheymaybeconfoundedbyevenmoderatelycomplexrelationships.Forexample,giventwovariables,XandY,eachofwhichisthoughttoinfluencetheother,thecross-sectionalpartialcorrelationmethodscannottestwhetherYcausesX,XcausesY,orboth(eachcausestheother).Bycontrast,stage-stateanalysis,linearpanelanalysis,andGrangercausalityanalysisareallcapableofprovidingevidenceaboutthetruecausalorderbetweenXandY,givenappropriatelongitudinaldata.Two-stageleast-squares(2SLS)methods(Berry,1984;Heise,1975;KesslerandGreenberg,1981;Markus,1979)maybeusedwithcross-sectionaldatatomodelnonrecursivecausalrelationships,relationshipsthatinvolvereciprocalinfluenceor"feedback"withinsomesetoftwoormorevariables.Incross-sectional2SLSmodels,problemsofmodelidentificationmayariseifinstrumentalvariablescannotbeuniquelyestimated.Inpaneldesigns,theproblemmaybesolvedbyusingfuturevaluesofpredictorstoestimateaninstrumentalvariableforthecurrentvalueofavariable.Counterintuitivethoughthismayseem,itisappropriateinasituationwhentheonlypurposeistoconstructanunbiasedestimateofavariable,Xt,thatisuncorrelatedwithmeasurementerrorinXattimet.ThisvariablemaythenbeusedtoestimatetheeffectsofXtonothervariables,buttherewillbesomelossofprecisionintheseestimates(KesslerandGreenberg,1981).Unlessthereareproblemsofautocorrelatederrorinpaneldata,2SLSestimationmaybeneithernecessarynordesirable.Toreturntothemainpoint,however,longitudinaldataprovidemoreflexibleandmoregenerallyapplicablemethodsforexaminingcausalorderthanthosepossiblewithcross-sectionaldata.Longitudinalmethodsofexaminingtemporalandcausalorderaremostappropriateforusewithtotalpopulationorpaneldata.Theymaybeusefulforrepeatedcross-sectionaldataatthegrouporaggregatelevel,withthesamequalificationsnotedinthesectiononOtherIssuesintheMeasurementofChangeregardingthemeasurementof92 华中科技大学硕士学位论文changeinrepeatedcross-sectionaldesigns.Ideally,stage-statemethodswouldbeusedtoascertaintemporalorder,andGrangertestsorlinearpanelanalysiswouldalsobeusedtotestthemagnitudeanddirectionofcausalinfluences.CausalAnalysisCausalanalysisoflongitudinaldatainvolvestheextensionofchangemodelstoencompassindependentvariablesinadditiontoorinsteadoftime,andsometimestheincorporationoftimeintotechniquesforanalyzingcross-sectionalmodels,eitherbyincorporatingsomemeasureoftimeasavariable,orbymakinguseoftwoormorewavesofdatatoensurethatasupposedcauseismeasuredatanappropriateintervalpriortoitssupposedeffect.Therearefour"pure"typesoflongitudinalmodels:(a)thevalueofthedependentvariable(s)isexpressedasafunctionofthevalue(s)oftheindependentvariables;(b)thevalueofthedependentvariable(s)isexpressedasafunctionofthechangeintheindependentvariable(s);(c)thechangeinthedependentvariablesisexpressedasafunctionofthevalueoftheindependentvariable(s);and(d)thechangeinthedependentvariable(s)isexpressedasafunctionofthechangeintheindependentvariable(s).Mixedmodels,inwhich(forexample)theindependentvariablesincludebothlevelandrate-of-changevariables(e.g.,populationdensityandpopulationgrowthrateasinfluencesoneconomicdevelopment)arealsopossible.Incausalanalysiswithcross-sectionaldata,weoftenphraseourhypothesesasthoughweweretestingmodelD:achangeinXproduces(leadsto,causes)achangeinY.Moretypically,however,itismodelAthatwetestincross-sectionalandlongitudinalanalysis.Correctlyphrased,modelAindicatesthatthelevelorvalueofonevariable(thedependentvariable)dependsonthelevelorvalueofoneormoreindependentvariables.Thisimpliesthatachangeinthedependentvariableisalsoafunctionofchange(s)intheindependentvariable(s),buttheactualformulationofthemodeltobetestedinvolvesvaluesofvariables,notchangesinvalues.Inaddition,itispossiblethatachangeinonevariableproducesasystematicchangeinanother,butthatthevaluesofthetwovariablesare93 华中科技大学硕士学位论文largelyunrelated.ThissuggestsaprocessinwhichtheinitialvaluesofXandYwereindependent,butchangesinXproducechangesinY.Forexample,levelsofnutrition(asmeasuredbypercapitacaloriesupply)mayinitiallybeunrelatedtolevelsofnationalfamilyplanningprogrameffort(countrieswithbothhighandlowlevelsofnutritionhavebothhighandlowlevelsoffamilyplanningprogrameffort),butincreasesinfamilyplanningprogrameffortmayleadtoincreasesinpercapitacaloriesupply,asindividualsmoreeffectivelyadjusttheirfertility,deliberatelyorinadvertently,tothecarryingcapacityoftheircountryorregion.Highlevelsoffamilyplanningprogrameffortarestillnotnecessarilyassociatedwithhighlevelsofnutrition,butimprovementsinfamilyplanningprogrameffortareassociatedwithimprovementsinnutrition.Theprocessdescribedhereisadmittedlycounterintuitive,butnonethelesspossible.Ifsuchaprocessexists,thenmodelDisappropriate,butmodelAisnot.ModelD,ontheotherhand,maybeappropriateinanysituationforwhichAisappropriate.Ifthelevelofonevariabledependsonthelevelofanother,thenifthesecondvariablechanges,thefirstmustalso(i.e.,thechangeinthefirstvariabledependsonthechangeinthesecond,ifmodelAiscorrect).Analytically,modelDmayresultfromtheuseoffirstdifferencemodels,assuggestedbyLikeretal.(1985).Inafirstdifferencemodel,allvariablesinthemodelareexpressedasrawgainscores.AnexampleofthepureformofmodelBmightbethecorrespondencebetweenthelevelofstress(asadependentvariable)andtheamountofchangeinincome(abigpayraisereducesstress,abigpaycutincreasesstress,regardlessoflevelofincome).ModelCisthestandardformfordifferentialequationmodels.Forexample,Richardson(1960)explainedarmsracesbetweenpairsofcountriesbyusingpairsofdifferentialequations:whereXandYrepresentlevelsofarmamentsinthetwocountries,jandkrepresentnonnegative"defense"coefficients(positiveinfluencesonthefeltneedforarms,basedonthelevelofarmamentsintheothercountry),aandhrepresentednonnegative"fatigue"coefficients(thedrainonthenationaleconomy,orunwillingnesstobuildupone"sown94 华中科技大学硕士学位论文armamentsfurther,giventhelevelofarmamentsalreadypresentinone"sowncountry),andgandhareconstant,positiveornegative"grievance"factorsthatmaylooselybeinterpretedasthehostility(iftheyarepositive)orfriendliness(iftheyarenegative)eachcountryfeelstowardtheother.Theright-handsideoftheequations,dX/deanddY/dt,areratesofchangeovertime;theleft-handsideoftheequationsareexpressedintermsoflevelsofthevariablesXandY.ModelCwasalsousedbyMauldinandBerelson(1978)inaregressionanalysistoexplainchangesincrudebirthratesinlessdevelopedcountries.Withchangeincrudebirthrateasthedependentvariable,levelsoffamilyplanningprogrameffortandindicatorsofsocialandeconomicdevelopmentwereusedastheindependentvariables.TsuiandBogue(1978)performedasimilaranalysiswithsimilarvariables,butusedmodelAwithalaggedendogenousvariable.AsMarkus(1979)explains,theuseofagainscoreasthedependentvariableisthesameasusingalaggedendogenousvariableexceptthatinthemodelwiththegainscoreasthedependentvariable,thecoefficientofthelaggedendogenousvariableisassumedtobeone.ForthelaggedendogenousmodelwithdependentvariableYandindependentvariableX,recalculating,Ifc=1,thentheequationtakestheformofastandardregressionmodel,withthegainscore(Y2-Y1)asthedependentvariable.Giventhesimilarityinthegainscoreandlaggedendogenousapproaches,itisnotsurprisingthatMauldinandBerelson(1978)andTsuiandBogue(1978)reachedpracticallyidenticalsubstantiveconclusions;eventheexplainedvarianceinthedependentvariableswaspracticallyidentical.Markus(1979)suggeststhatthereisnothingtobegainedbyconstrainingthecoefficientcintheabovemodeltobeequaltoone,andrecommendstheuseofthelaggedendogenousvariableinsteadofthegainscoreasadependentvariable.ThisrecommendationisconsistentwiththerecommendationsofCronbachandFurby(1970),butasalreadynoted,Likeretal.(1985)offeradissentingview.95 华中科技大学硕士学位论文MethodsofCausalAnalysisofLongitudinalData.Allofthemethodsusedforcross-sectionaldataanalysismaybeusedwithequalfacility(andwithequalconcernfortheunderlyingassumptionsandlimitationsofthosemethods)intheanalysisoflongitudinaldata.Simplefrequencies;measuresofassociation,dispersion,andcentraltendency;andcontingencytablemethodsareallapplicabletolongitudinaldata.So,too,areparametricandnonparametrictestsforstatisticalsignificance.Multivariate(ormultivariable;seeKleinbaumetal.,1988)methodsmayalsobeused.Theprincipaldifferenceisthatinlongitudinalanalysisthemethodsmaybeusedontime-ordereddata,andmaybeusedtoanalyzevariationinasinglevariablemeasuredfortwoormoreperiods,insteadoftwoormorevariablesmeasuredforasingleperiod.Table5.1presentssomeappropriatemethodsofanalysisfordifferentcombinations,intermsoflevelofmeasurement,ofdependentandindependentvariables.Latentvariablestructuralequationmodels(Bollen,1989;Hayduk,1987)havebecomeastandardinbothcross-sectionalandlongitudinaldataanalysis.Linearpanelanalysis(KesslerandGreenberg,1981)andmultipleregressionandpathanalysis(Heise,1975;Johnston,1984;Kleinbaumetal.,1988)mayberegardedasspecialcasesofthebroaderlatentvariablestructuralequationmodel.Whenbothdependentandindependentvariablesaremeasuredonacontinuousscale,andwhenthenumberofperiodsforwhichthevariablesaremeasuredislarge,transferfunctionormultivariatetimeseries(BoxandJenkins,1970;McClearyandHay,1980)maybeappropriate.Alternatively,spectralanalysis,avariantoftime-seriesanalysis(JenkinsandWatts,1968;Wei,1990)maybeappropriateforproblemsinvolvingpredictionstoonetimeseriesfromoneormoreothertimeseries.Withcategoricalormixedvariablesaspredictorsofacontinuousdependentvariable,analysisofvariance(ANOVA)forcategoricalpredictorswithanalysisofcovariance(ANCOVA)forcontinuouspredictorsmaybeappropriateifthedatasatisfytheassumptionsofhomogeneityofvarianceandequalcellsizes(BohrnstedtandKnoke,1982;IversenandNorpoth,1987;WildtandAhtola,1978).Dummyvariableregressionisa96 华中科技大学硕士学位论文variantofANOVAthatmayalsobeworthconsidering.Ifthereisonecategoricalpredictorandadependentvariablethatisatleastordinal,nonparametricmethodsanalogoustoANOVAmaybeworthconsidering;forexample,Friedmantwo-wayanalysisofvarianceorKruskal-Wallisone-wayanalysisofvariance(Daniel,1978;Siegel,1956).Inregressionanalysisandrelatedmethods,longitudinalanalysismaygiverisetoproblemsthataresomewhatdifferentfromthoseencounteredincross-sectionalregressionanalysis.Autocorrelatederrorisapotentialprobleminbothcross-sectionalandlongitudinalmodels;incross-sectionalmodels,itmaybetestedusingtheDurbin-Watsonstatistic,butforlaggedendogenousvariables,amodificationoftheDurbin-Watsontestisrequired(Johnston,1984).Inlatentvariablestructuralequationmodels,correlatederrormaybemodeledwithintheanalysis,butunlessthemodeliscorrectlyspecified,itmayfailtoconverge,ormayproducenonsensicalparameterestimates(e.g.,negativevarianceestimates).Collinearityisalsoasmuchormoreaprobleminlongitudinalanalysisasincross-sectionalanalysis.Potentially,problemsofmodelspecificationaremagnified,notreduced,inlongitudinalanalysis.Forcategoricaldependentvariables,thesametechniquesthatareusedforcross-sectionalanalysismayalsobeusedforlongitudinalanalysis:discriminantanalysis(Klecka,1980;Kleinbaumetal,1988;VandeGeer,1971)orlogitmodels(AldrichandNelson,1984)forcontinuousindependentvariables,andlog-linearmodels(KnokeandBurke,1980;Lindemanetal.,1980)forcategoricalormixedindependentvariables.Ifthedependentvariableisameasureofchangeinacategoricalvariable,thenmultistatelifetablemodels(NamboodiriandSuchindran,1987)forcategoricalpredictors,andeventhistoryanalysis(Allison,1984;Blossfeldetal.,1989;CoxandOakes,1984;NamboodiriandSuchindran,1987)forcontinuous,categorical,ormixedindependentvariables,providepowerfultoolsfortheanalysisofstage-statechange.Eventhistoryanalysisisafamilyofmethodsthatlinksregressionanalysisandtheanalysisoftransitionmatricesfordatathatincludemeasurementsatseveralperiods.Eventhistoryanalysistypicallyallows97 华中科技大学硕士学位论文morepredictorsandrequiresfewerperiodsthanARIMAtime-seriesanalysiscanconvenientlyormeaningfullyhandle.Italsoallowstheuseofeitherageorchronologicaltimeastheunderlyingtimecontinuum,andtheuseoftheothertimevariableasanindependentvariable,sothatbothhistoricalanddevelopmentaltrendsmaybeexamined.Multistatelifetablemodelsmay,inasense,beregardedasanonparametricformofeventhistoryanalysis.Theyanalyzestage-statetransitionswithoutmakinganyassumptionsabouttheunderlyingtemporaldistributionofthosetransitions(asineventhistoryanalysis),andinthatsensearemoreflexiblethaneventhistoryanalysis,buttheyalsohavegreaterdifficultyhandlinglargenumbersofindependentvariables.Alloftheseanalyticalmethodsareapplicabletototalpopulationandpaneldata,and,withcaution,toaggregatedcategoriesorgroupsofcasesinrepeatedcross-sectionaldata.LongitudinalandCross-SectionalDataAnalysis.Assumethatwehaveselectedatheoreticallyappropriatesetofdependentandindependentvariables.Assumefurtherthatwehaveagreeduponthecausalorderingofthevariables,basedontheoryandperhapswithempiricalsupportbasedonpastresearch.Assumefurtherthatwehavebeenable,withappropriatetransformationsofourvariables,tocastthecausalmodelintoagenerallinearmodel(e.g.,latentvariablestructuralequations,multipleregression,ANOVAandANCOVA,ordiscriminantanalysis),andthatthemodelisidentified(seeHeise,1975,foradiscussionofmodelidentification).Supposenowthatwewanttocalculatethestrengthofthedirectcausalrelationships(andifweusepathanalysisorlatentvariablestructuralequationmodels,wemayalsocalculateindirecteffects).Isthereanyreasontopreferlongitudinaldatainsteadofcross-sectionaldataforthispurpose?Schoenberg(1977)demonstratedthatundercertainconditions,theapplicationofdynamicmodelstocross-sectionaldataproducedefficient,unbiasedestimatesoftheparametersoftheunderlyingdynamicmodel.Thefundamentalconditionforthistooccurwasthattheunderlyingdynamicprocessbenonergodic,thatis,thatitdependontheinitialstateofthesystem.Forergodicsystems,systemsthatdonotdependontheinitial98 华中科技大学硕士学位论文stateofthesystem,butthatwouldresultinanidenticalexpectedstateofthesystemforanytimeperiod,thecalculationofadynamicmodelbasedoncross-sectionaldataresultsinbiasedandinefficientestimatesofparameters.Anexampleofanergodicsystemisoneinwhichchangesintheexogenousvariablesarerandom,andtheexpectedvaluesoftheexogenousvariablesarethesameatanytimetasatanyothertime(t-k).Mathematically,E(Xj)=X0,whereXoistheinitialvalueofX.Anexampleofanonergodicsystemisoneinwhichchangesintheindependentvariablesarenotrandombutdependonpastvaluesoftheexogenousvariable.Inotherwords,anautoregressiveprocess,inadditiontorandomvariation,generatesthevaluesoftheexogenousvariables,andtheexpectedvalueofXisnotconstant.Mathematically,E(X,)=FXt-k,whereXt-kisavectorofpastvaluesofXandFisavectorofcoefficientsforX.Whethercross-sectionaldatamaybeusedtocalculatethedynamicrelationshipbetweentheexogenousvariables(X)andthedependentvariable(Y)woulddependonwhichprocess,randomvariationorautoregression,producedthechangesinX.Bycontrast,longitudinalmodelsmaybeusedforbothergodicandnonergodicprocesses.Asecondpotentialproblemwithusingcross-sectionaldatatoestimateparametersforalongitudinalmodelisillustratedbyFirebaugh(1980)withdataonfertilityandliteracy.Table5.2andFigure5.1,bothadaptedfromFirebaugh(1980:340-341),illustratethatcross-sectionalandlongitudinalcorrelationsmaybeoppositeinsign,andyetmaybothbecorrect.Cross-sectionally,fertilitywashighestinthosedistrictsofthePunjabinIndiawiththehighestlevelsofliteracy,beginningin1961andcontinuingthrough1971.Withineachdistrict,however,asliteracyincreasedovertime,fertilitydeclined.Inthisexample,cross-sectionalandlongitudinaldataproduceverydifferentconclusionsabouttherelationshipbetweenfertilityandliteracy.ThissamepointwasillustratedbyMenardandElliott(1990a)andGreenberg(1985)withregardtotherelationshipbetweenageandillegalbehavior.AsFirebaughremarks,determiningwhichofthetwopatternsismoreappropriateorimportantisatheoreticalissue,notanempiricalissue,butthepointhereis99 华中科技大学硕士学位论文thatcross-sectionaldatacannotberoutinelyusedtomodeldynamic,longitudinalrelationships.ThispointisfurtherreinforcedbyMenardandElliott(1990a)basedonactualcross-sectionalandlongitudinaldata,andbyDaviesandPickles(1985),whodemonstratedinasimulationstudyofadynamicmodelthatcross-sectionalanalysisfailedtomakecorrectinferencesaboutpredefinedpopulationparameters,butlongitudinalanalysisestimateswerewellwithinthelimitsofsamplingerror.LongitudinalVersusCross-SectionalDataandAnalysisThismonographbeganbycontrastingpurecross-sectionalresearchwithlongitudinalresearch,anddidsoforthepurposeofdefininglongitudinalresearch.Itendsnowbysummarizingthedifferencesbetweenthetwo.(1)Longitudinalresearchtypicallycostsmore.Iftheresearchquestionorhypothesiscanbeaddressedsatisfactorilywithcross-sectionaldata,thereislittleornopointintryingtouselongitudinalresearchtoanswertheresearchquestionortestthehypothesis.(2)Longitudinalresearchhasthesameproblemsandissuesofdataqualityandadequacyofsamplingascross-sectionalresearch,andafewmorebesides.Therearewaysofaddressingtheseissues,butagainifcross-sectionalresearchisadequatetothetask,itistobepreferredoverlongitudinalresearch.Figure5.1GeneralPatternoftheRelationshipbetweenFertilityandLiteracy(3)Cross-sectionalresearchcannotdisentangledevelopmental(age)trends,historical(period)trends,andcohorteffects.Wheneverallthreetypesofeffectsarepossible,thestudyofanyorallofthesethreetypesofchangerequireslongitudinaldata.(4)Thedescriptionandanalysisofhistoricalchangeabsolutelyrequirestheuseoflongitudinaldata;also,longitudinalmethodsofanalysissuchasdifferentialequationmodels(inwhichdifferentiationisperformedwithrespecttotime),ARIMAtime-seriesmodels,andeventhistoryanalysismayprovidemorepowerfulanddetailedanalysesofhistoricalchangethanwouldthosemethodscommontobothlongitudinalandcross-sectionalanalysis.100 华中科技大学硕士学位论文(5)Thedescriptionandanalysisofdevelopmentaltrendsmaybeattemptedwithcross-sectionalage-specific(orstage-specific)data,buttheresultswillnotnecessarilyreflectthoseobtainedbyusinglongitudinaldata.Insofarasdevelopmentalchangeisconceivedasreflectingtheexperienceofindividualsastheyageorpassthroughsuccessivestages,longitudinaldata,becausetheyreflectintraindividualchangeratherthaninterindividualdifferences,aretobepreferred.(6)Unlessthereisgoodreasontobelieveotherwise(e.g.,unlessitisknownthatadynamicprocessisnonergodic),itshouldbeassumedthatlongitudinaldataarenecessarytoestimatetheparameters,efficientlyandwithoutbias,ofanydynamicprocessinthesocialsciences.(7)Unlessrecallperiodsareshort,orproblemsofrespondentconditioningaresevere,orunlessitcanbedemonstratedthatproblemsoflong-termrecallareminorornonexistent,prospectivepaneldesignsortotalpopulationdesignsaregenerallytobepreferredoverotherlongitudinaldesigns.(8)Testingfortemporalorcausalordershouldbeanintegralcomponentintestingcausalhypotheses.Alongwithcovariation(asindicatedbythestrengthoftherelationship)andnonspuriousness(asindicatedbythecontinuedsignificanceoftherelationshipwhentheeffectsofothervariablesareconsidered),temporalorcausalorder,asindicatedinstage-statetemporalorderanalysis,Grangercausality,orlinearpanelanalysis,isacrucialelementinanycausalrelationship.Inlightoftheseconclusions,whatroleremainstocross-sectionalresearch?Themostreadilyapparentansweristhatcross-sectionalresearchremainsimportantfordescribingvariablesandpatternsofrelationshipsastheyexistataparticulartime.Cross-sectionalresearchmustalsobeconsideredasarelativelylessexpensivealternativetolongitudinalresearchforthoseinstancesinwhichcross-sectionalresearchisademonstrablyadequatesubstituteforlongitudinalresearch,andforexploratoryorpreliminaryinvestigationofhypothesesorresearchquestionsthatinvolvedynamicmodels.Iftheconcerniswith101 华中科技大学硕士学位论文differencesbetweenindividualsofdifferentagesatonetime,andnotwithinferringintraindividualchangesthatoccurwithageoverthelifecourse,cross-sectionalresearchisagainpreferable.Theconclusionisinescapable,however,thatforthedescriptionandanalysisofdynamicchangeprocesses,longitudinalresearchisultimatelyindispensable.Itisalsothecasethatlongitudinalresearchcan,inprinciple,domuchthatcross-sectionalresearchcannot,butthatthereislittleornothingthatcross-sectionalresearchcan,inprinciple,dothatlongitudinalresearchcannot.Longitudinalresearchisnotthecureforalltheproblemsofcross-sectionalresearch.Itcannotcureproblemsofpoorresearchdesign(quitethecontrary-itislikelytomagnifysuchproblems),inadequatesampling,orfailuretopayattentiontotheassumptionsandlimitationsofanalyticaltechniques.Longitudinalresearchisnotanabsolutenecessityforallresearchproblems;thereismuchthathasbeendoneandmuchthatcanbeaccomplishedwithcross-sectionalresearch.Longitudinalresearchisbestviewedasapowerfultool,butonlyoneofseveralthatisavailabletothesocialscientist.Iftheresearchquestionorhypothesisdoesrequirelongitudinaldataandanalysis,thenthecostsoflongitudinalresearch,iflongitudinalresearchisusedwell,arelikelytobeamplycompensatedbythequalityoftheresults.102 华中科技大学硕士学位论文附录3:翻译项目译文丛书编辑简介纵向研究关注的是一段相对长的时间内的数据收集和分析。原则上,相同的变量会用同一分析单位持续测量至少两个时间周期。而横向研究的数据收集则是集中于同一个时间点的。正因如此,应该将纵向研究与横向研究区分开来。民意调查是一个典型的横向研究案例,即在差不多同一时间对一组受访者(例如投票人口)进行调查。相比之下,纵向设计的调查可能会对同一组选民在两个不同的选举期做两次采访(从而形成一个双向的追踪调查研究)。由于两种设计----纵向及横向----都是非实验性的,所以因果关系的推理总是相当复杂。然而,纵向研究在这方面具有主要优势,因为某种关系的时间顺序可能需要更确信的论证。也就是说,当显示Y实际发生在X之后时,我们得出X“导致”或者某种程度上“影响了”Y的发生。让我们举例对此加以说明。假设刑事司法学者MaryWhite博士希望检验“年龄的增长使得人们更害怕犯罪”这一论断。为此,她从哥达市随机选择了1000位成人进行被害调查,所有人都是一个月采访一次(标记时间为t1)。在分析受访者回答的过程中,她发现X(受访者年龄)与Y(害怕犯罪指数)有着强烈的相关性。然而,她还是没有就此简单得出年龄的增长使得人们更害怕犯罪这一结论。相反,她怀疑X和Y之间的关系是虚假的,它是实际犯罪经验(Z)对两者的共同关系作用的结果。也就是说,年龄较长的人更有可能成为犯罪的受害人,而那些有受害经历的人更容易对此感到惧怕。White博士于是又就同一批受访者在t2时间段和6个月后的t3时间段分别做了两项调查(对最近特定的受害事件添加了更多的条目)。她发现,早期犯罪经历(t2)和后期犯罪恐惧(t3)之间存在着强烈的相关性。此外,这种相关性在每个年龄组(青年,中年,老年)都强烈存在。这些追踪调查表明,受害事件本身,而不是年龄的增长,导致了对犯罪的恐惧。当然,还有其它的问题需要考虑,包括受访者流失、回忆偏倚、以及可能来自其它途径的不可靠信息。然而,此次追踪调查还是让White教授103 华中科技大学硕士学位论文距离分清犯罪恐惧的决定因素更近了一步。上述纵向设计描述的灵感源于Menard博士提供的许多精心挑选的数据实例中的其中一个,这些都是Menard博士从青年调查、犯罪调查、选举调查和生育调查等等中仔细挑选出来的。这些例子可以帮助研究人员了解收集纵向数据的方法,而这一点在本书的第一部分有具体论述。接着,本书介绍了纵向分析的争议问题。例如,如何衡量变化这一棘手的问题,包括差异、残差和滞后。虽然Menard博士指出了研究的困难面,但还是为读者提供了很好的研究机会,并概述了一些有价值的分析策略。看完本书后,学生们应能够推出自己的纵向研究方案。---MichaelS.Lewis-Beck纵向研究作者:SCOTTMENARD1.绪言全国范围内的纵向数据收集已有300年之久的历史,始于新法兰西(加拿大)而后又延续到魁北克省的定期普查(1665-1754年)。虽然这些都不是第一次人口普查,但他们却具有一定的代表性,代表了人口普查数据的第一次定期收集,与以往不定期进行的单一孤立人口普查截然不同。后者在公元前1491年就在以色列开始了(Tomlinson,1976)。其它持续到现在的定期人口普查包括:自1749年来的瑞典人口普查,1769年开始的挪威和丹麦人口普查,以及1790年以来的美国人口普查。其中美国与其它国家又有所不同,因为自其成立的第一个十年里,它就实施了纵向人口普查,并一直持续到现在。在个人层面上,Baltes和Nesselroade(1979)以及Wall和Williams(1970)都引用了早在1759年就收集好的纵向数据(主要是实例分析和传记资料)。第一次世界大战之后,涉及多个研究对象的长期儿童发展研究在美国蓬勃发展,并在20世纪七、八十年代已有了关于社会和行为科学领域的广泛纵向研究。纵向研究的蓬勃发展证明,研究人员和主要供资机构都认同它的重要性。一般而言,当人们问起纵向研究的价值的时候,通常会着重于其设计和分析等研究质104 华中科技大学硕士学位论文量方面,而不是纵向研究的价值本身,因其能解决其它类型的数据收集设计和分析并不能充分解决的问题。纵向数据和方法的使用最近变得非常流行,而且对于很多人来说,纵向研究被吹捧成为了建立时间顺序、测量变化、以及解释更强因果关系的灵丹妙药。尽管这些方法确实有一定的优势,但它们还是存在着成本上的问题及其它诸多困难,而且对于建立因果顺序来说,纵向研究并不总是用得上(Davis,l985;Blalock,1962),尤其是在变量的时间顺序已被事先知晓的情况下(例如,诸如性别、种族和年龄的生物或遗传特征),而且可以肯定的是,纵向数据并不能矫正拙劣的研究设计方案和数据分析。_____________________________________作者注:非常感谢DelbertS.Ellion和两位匿名评审的建议,同时也感谢本书的图表原作者ZekeLittle。定义在本书关于纵向研究的讨论中,“纵向”这个术语指代的是一系列的研究方法,而不是单一的某种方法(Zazzo,1967)。最好的方法是将其与横向研究进行对比学习。在纯横向研究中,对每个个体、研究对象、国家或研究实例,都会有一次测量;各个项目、概念或变量的测量都只适用于一个单一的时间段或时期;而且关于每个实例的各个变量的测量都发生在一个较小的时间跨度内(理想情况下,每个实例的各个变量的测量应同时进行),因而这些测量可以被认为是同时发生的,也就是说,所有实例中所有变量的测量都发生在同一时间周期。而根据特定的研究,每个时期可能以秒、天、月、年、或(原则上)地质纪元为单位。在社会及行为科学领域,时间周期的计量会有所不同,一些实验室里的实验是以分钟计的,而一些跨国研究则以年计。纵向研究应根据研究中使用的数据和分析方法来定义。纵向研究应满足如下条件:(1)每个项目或变量的数据都是在两个或两个以上的不同时间周期收集的;(2)从上一时期到下一时期的研究对象或实例应保持一致,或者至少也是有可比性的;105 华中科技大学硕士学位论文(3)分析应包括不同时期间的所有数据比较。最低限度内,任何真正的纵向设计都应能够对一个时期到另一个时期的变量差异和变化进行测量。根据这个定义,一些类型的研究就可能被认为是纵向的。在某个研究中,应能够在两个或以上不同的时期收集数据,因为这些不同时期在每个时期范围内是有一套相同的实例和变量的。这是一个预期追踪调查设计。另外,也可以在单个时期收集数据,并持续几个时期,通常最后一个时期应包含数据收集结束的时间。这种回溯追踪设计在预期追踪调查设计的每个方面都可能是一致的,除了数据收集实际发生的次数,以及受访者要求的回忆时间长度。在这两种追踪设计中,实例和变量从上一时期到下一时期都保持不变。第三种是,在两个或两个以上的时期范围内收集同一套变量的数据,但应包括每个时期的非恒定(但有可比性)的实例。在此重复横向设计中,各个时期的数据可被视为是一个单独的横向数据,但由于从上一时期到下一时期的实例是有可比性的(例如,使用相同人口的概率样本),我们可以在不同时期进行比较。这些不同类型的纵向研究在第三章有更详细的介绍。Baltes和Nesselroade(1979)以及Wall和Williams(1970)曾提议缩小纵向研究的定义范围,只涵盖预期的追踪设计部分,但他们也承认(Baltes和Nesselroade,1979:4;Wall和Williams,1970:14)他们并没有在这一点上达成共识。BaltesandNesselroade指出,也许应在一个特定的学科背景下对纵向研究进行定义。对于心理学的发展研究来说,可能只需考虑纵向追踪设计,而对于其它学科来说,这样的限定似乎又过于死板。我们采用更广泛的纵向研究定义主要是基于以下两点原因:首先,关于纵向研究的构成目前尚未达成共识;其次,不同时期的各种数据收集方法的不同特征是否都应予以考虑。本书的其它部分组织如下。第二章讲述纵向研究的目标,以及在不同历史变化和发展变化中遇到的困难。第三章介绍并讨论了收集纵向数据的基本设计方案。第四章讲述了可能影响纵向数据质量的问题。第五章概述了纵向分析的方法。2.纵向研究的目标纵向研究主要有两大目标:描述变化规律,并建立因果关系的方向(正的还是负的,从Y到X还是从X到Y)和量级(量级为零则表示两者不存在因果关系)。变106 华中科技大学硕士学位论文化通常会根据以下两个连续体中的一个来衡量:时间顺序(以下简称时间)或是年龄。时间用来衡量正在研究的外部实例或对象(如1989年8月28日下午2:22)。年龄用来衡量正在研究的内部对象或实例(如出生后的38年,7个月,8小时,27分钟)。某种意义上来说,年龄代表受访者的生物时间。是选择时间还是年龄作为基本的连续体是很重要的,而且有些时候,出于某种目的,在同一个分析过程中需要同时考虑这两个因素。横向衡量年龄(如1980年40岁的受访者和50岁的受访者的区别)和纵向衡量年龄(如1980年40岁的受访者和同一批受访者在1990年50岁时的差异),这两者是有显著区别的,同样也很重要。当横向衡量年龄时,40岁和50岁的变量的差异可以解释为某一特定时间的出生组群和年龄组群之间的差异。而当纵向衡量年龄时,其差异就应被解释为同一出生组群或年龄组群在一段时间内的发展差异。年龄、时期和组群效应因其衡量变化的方式不同,作为概念上的明显不同连续体的时间和年龄间的差异可能会严重影响有关变化的研究。为了弄清楚这些问题,同时也为了给历史变化和发展变化的测量打下一个坚实的基础,我们有必要对年龄、时期和组群作为变量和分析单位的不同进行讨论。Glenn(1977:8)给出了一个组群的人口学定义:“一个组群指代的是按照地理区域或其它方式划分的一组人群,他们在同一给定时期内经历了同样重要的生活事件。”Ryder(1965)给出了一个类似的定义。而Glenn和Ryder也都注意到,尽管“组群”这个术语长期以来基本上都用以指代出生组群(那些出生在某一特定年份或时期内的人们),人们也可以用其它方式定义组群,比如说结婚或离婚的年份、退休年份、就业的第一年、或是除了出生年份的其它事件发生的年份。Gractz(1987)用“事件组群”来描述组群,而不是出生组群。假设我们想要验证这一推想:随着年龄的增长,人们政治上会变得更加保守。其中的一种验证方法就是:在某一年份对不同年龄段的个体做个调查,询问他们的政治态度,并对比年轻的和年长的受访者。如果根据调查,年长者比年轻人在政治上更为保守,那么我们可能得出结论:随着年龄的增长,人们政治上会变得更加保107 华中科技大学硕士学位论文守。但这只是一个貌似合理的择一假设,因为样本中的保守的年长者有可能在年轻的时候就很保守,而那些不那么保守的年轻人可能在年老的时候还是不那么保守。换句话说,按年龄横向差异来分析可能会造成困惑,因为差异有可能不是年龄导致的,而是由于出生组群的不同导致的。也可以这么说,在某一特定年龄段内,相对年轻时候的不同生活经历可能会对不同个体的态度造成长期的影响。现在我们假设不做横向研究,我们只选择一个出生组群,并从这一组群中选取受访者每5年或每10年进行一次访谈,直到受访者死亡为止。在研究结束时,如果我们发现受访者随着年龄的增长而变得更为保守的话,我们就可能得出结论:随着年龄的增长,政治保守度也增强。然而,同样的,这也只是一个貌似合理的择一假设,因为有可能在任何年份年龄组之间都没有真正的差别,但不管年轻的还是年长的,在一段时间内,每个人都变得更加保守,而这与年龄根本没有关系。这表明了历史效应,是具体到年份或时期的,而不是年龄。换句话说,当下时间可能会对政治保守性有立竿见影的影响,而不论年龄大小。时期差异问题不会表现在横向研究里,因为它只有一个时期。而组群差异问题也不会表现在纵向研究里,因为它只包含一个组群。由于横向研究和单组群纵向研究都不能消除出生组群和时期效应的其它假设。那么,把这两者结合起来,并采用多年份、多组群设计方案似乎就合情合理了,我们就可以在测试年龄对政治保守度的影响的时候,同时对组群和时期进行控制。但问题在于,如果我们假设年龄、时期和组群的影响都是线性的,那么只要控制了其中的两个变量,第三个变量也就会被控制。因为这里衡量的年龄、时期和组群都是线性相关的;任何一个都是其它两个的线性函数。在数学上,组群(出生年份)=时间周期(年份)-年龄(出生后的年数)。我们在测试政治保守度随着年龄的增长而增长这个假设时再次陷入了困境。例如,包括所有三个元素(年龄、时期和组群)在内的回归方程将会导致完全的共线性。如果没有对时期和组群加以控制,我们发现的任何年龄效应都有可能是组群效应、趋势或两者共同作用的结果。Glenn(1977)对这个问题作了详细讨论,同时也详细说明了组群分析的其它问题(抽样、样本死亡率等等)。108 华中科技大学硕士学位论文线性关系及组群的概念性地位。人们曾尝试克服年龄、时期和出生组群间的线性关系导致的问题。这些措施包括使用虚拟变量回归分析,同时限制模型中关于参数的某些假设(Mason等,1973),以及重组或事先去除三种影响类型中的一个或多个(Palmore,1978)。这些方法,尤其是虚拟变量回归分析模型,在方法论上是相当具有争议性的,包括该假设的合理性和违背设定的假设去处理年龄、时期和组群间线性关系的问题而导致的后果(Baltes等,1979;Glenn,1976及1977;Knoke和Hout,1976;Mason等,1973;Rodgers,1982a及1982b;Smith等,1982)。此外,这些方法并不能解决线性关系的问题,因为Mason等(1973)的模型假设不是所有的影响都是线性的,而在Palmore的方法中,必须预先消除一个影响效应。这些假设可以很容易的被建成普通的最小二乘回归模型。需要注意的是,线性相关的问题适用于出生组群,在其它组群类型中并不一定适用。如果某个事件不是依赖于年龄或时期,那么基于该事件的事件组群就不是线性依赖于年龄或时期。那么,在某些情况下,线性关系可能会预先被消除。关于年龄、时期和组群效应的第二个也是更根本的一点是,作为个体总和的组群是分析的单位、研究的实例。Ryder(1965)就是在这个层面上来使用组群这个术语的。并且这一术语也被用于一些其它的组群效应的研究(如Carlson,1979;Lloyd等,1987;Wetzel等,1987)。Baltes等(1979)讨论了组群的三个可能概念(错误或干扰;泛化维度;理论和过程变量),其中,泛化维度将组群作为分析单位使用,而不是作为理论变量。甚至还有些研究使用组群来作为解释变量,它们也认识到了组群作为分析单位的作用(如WrightandMaxim,1987)。组群是个体(实例)的集合。作为实例,人们可能会按与其它实例(个人、城市、国家)相同的方式对它们进行研究。在社会科学研究中,组群与其它实例集合一样,有可衡量的特征,而这些特征有些是内在地聚合在一起的(如规模、性别比例和民族组成),而有些是包含在组群内的个体的求和(被捕总人数)或平均值(终身收入的中位数)。相比之下,我们不衡量这样的年龄或时期的总体特征,但是我们可能会针对某一特定年龄或时期测量其总体特征。年龄和时期是时间和变量的集合,并不是分析单位。它们可能被用来划定某一特定研究分析的实例,但通常来讲,它109 华中科技大学硕士学位论文们本身并不能作为社会研究的分析单位。年龄、时期和出生组群分别回答了以下三个问题:“你多大了?”“这是什么年份?”以及“你哪一年出生?”对于“你多大了?”这一问题的答案可用于解释下列现象:在婴幼儿期尿裤子是最为常见的,在青春期违法行为发生率是最高的,65岁之后退休是最为常见的。年龄为行为提供了发展性说明。对于“这是什么年份?”这一问题的回答也可用于解释一些行为方式:在美国,非法药物的使用在1960年之后较往年发生得频繁,而种族歧视在1960年之前比其之后明显。时期提供了一个本质上是基于史实的、并有助于找出那些能够为某一特定行为提供最合理解释的历史事件的解释,或者至少是为上述解释提供了薄弱的佐证(Hobcraft等,1982)。用“你哪一年出生?”这一问题的答案来解释发生的行为可有两种方式。第一种方式我们可以称之为“东方星相理论”:在特定年份出生的个人会具有在该年份出生的人的特性。例如,根据东方占星术,在火象马年出生的女性(60年循环一次)有杀害她们丈夫的倾向。对于大多数社会科学家来说,用这种方法来解释杀人现象是相当不令人满意的;然而,根据人口资料局的文件记录(1989),它的确不仅影响实际的出生率,还影响报道的(但不一定是真实的)日本女性出生日期。另外,某人出生的年份根据其在特定年份的岁数(发展状况)或是特定事件期间(历史事件记录)来解释其行为。换句话说,以出生年份衡量的出生组群效应可代表年龄和时期效应的相互作用。组群效应:概念重建及替换。理解组群效应的方法之一就是把它看作是年龄效应和时期效应的相互作用。另一种方法是,把能够产生明显组群效应的因素看成是与出生组群有关的一些特征或特征集合,而不是组群成员本身。这样一来,问题就变成了确定组群的合适特征或特征集合,而这是一个理论上的问题,不是方法论的问题。针对该问题的其中一个解决方案具有潜在的广泛适用性:按出生年份计算的组群这一概念,代替了在某一出生组群出生的个体数量以及组群规模。Ryder(1965)认为,“与其相邻元素相关的组群规模是其生命周期环境的一个持久的、令人瞩目的特征。”Mason等人(1973)注意到,年龄、时期和组群这三个变量可以代表其它不可110 华中科技大学硕士学位论文测变量。他们表示,“如果组群规模是导致特定实质问题差异的变量,那么,在可以构造测量规模的条件下,就没有必要把这样的组群归入该变量参数中,因为还有其它首选的变量。”他们还注意到,使用组群规模可以消除因估计能力产生的问题,因为一旦它们的虚拟变量回归模型构建起来,就可以使分析结果变得更有把握。Hobcraft等(1912)和Rodgers(1982a)提出了类似的看法。Ryder(1965)认为,规模只是用于区分不同组群的特征之一;然而,组群规模却是在研究中发挥最重要作用的特征,对此,Easterlin于1968年发表了一本关于组群规模对于劳动力影响的专著,接着又于1980年发表了一本专著,论述了组群规模对一系列社会问题的影响,包括失业、离婚和犯罪(Easterlin,1987)。总而言之,当组群规模或一些其它的组群特征(或者是设计年龄和时期的某个非线性相互作用项)对于年龄、时期和组群效应的研究在概念上和理论上更为适合的时候,人们会运用以出生年份来衡量的组群这一概念。这至少可以对帮助人们认识年龄、时期和组群在概念上是非常不同的。如上所述,虽然人们可能会从一个纯方法论的角度来把组群成员作为一个解释变量,但不论是理论上还是实质上,这么做一般都是不恰当的。年龄和时期更适合作为解释变量,而且年龄比时期更适合(Hobcraft等,1982)。理想的情况是,人们摒弃时期和组群,代之以能够在任何因果分析中都能运用的变量。在分析发展变化和历史事件变化的过程中,使用基于多个年份、多个组群的设计,再加上对于年龄、时期和组群效应的适当运用(即,利用组群特性,或者某一年龄与时期的非线性的相互作用),我们将能够测试年龄是否对政治观点、时期效应最终结果及组群成员有影响。在把年龄效应运用于任一研究之前,我们应先找出解决年龄、时期和组群效应混乱关系的方法,不管该方法是理论上的(如,在Esterlin及其他作者的著作、或是某一组群效应预先消除的基础上来利用组群规模)还是方法论上的(如,运用Mason等人的虚拟变量回归技术)。在上文政治保守度的例子中,消除组群成员身份对政治态度的影响、或是假设(理论上)组群成员身份只通过组群规模(或是其它一些组群特征)施加影响,这在理论上是可行的。一旦做到这一点,就可能做到消除年龄(发展层面的)以及时期(历史层面的)对政治态度的不111 华中科技大学硕士学位论文同影响。值得注意的是,如果没有纵向数据,就不能清楚地将发展性效应、历史性效应及组群成员身份效应区分开来。时期效应:随着时间的变化。如果能够把年龄、时期和组群效应区别开来,那么就有可能检测到随时间而发生的变化。通常,这意味着无视组群效应,或是用诸如组群规模这样的组群特性来指代组群效应。此外,如果我们只关注时间顺序上的变化(历史性变化),而不是根据年龄不同的变化(发展性变化),我们要么就得确定它与年龄是完全没有关系的,要么就得把年龄算作是一个解释变量,或者根据具体年龄的比较来控制年龄变量。纵向研究的一个关注点是对于随时间的推移而产生的数值和变量变化的简单描述。在个人分析层面,这可能包括宗教信仰、政治保守度或是酗酒方面的变化。通常都需要考虑这种可能性,即个人层面的变化代表的是发展性变化,而不是历史趋势。从总体分析层面看,我们可以用犯罪率或受害率的变化、工人的生产率或人均国民生产总值、学术能力测试(SAT)成绩、或是婴儿死亡率来作为衡量社会进步或倒退的指标,衡量对象包括满足基本社会需求、或是实现理想的社会目标。在这个层面,控制年龄的影响是有可能的。婴儿死亡率本身已经是限于特定年龄群的(尽管在婴儿一岁之前,其母亲的年纪可能会对婴儿死亡的可能性造成影响),而SAT主要适用于16-18岁的个人。因而,年龄完全地,或者是在很大程度上是受这些方法的控制的。犯罪率和受害率很受人口年龄分布的影响(如Chilton和Spielberger,1971;Skogan,1976),而且在评估这些变量的历史发展趋势的过程中控制年龄构成是很合理的。人均国民生产总值受抚养率的控制(低于15岁的加上超过65岁的人,对应在16-64岁区间内的人的比例),而且工人生产力也可能受工人年龄分布的影响,但如果在数据收集时期内,这些变化很缓慢、或者保持不变,那么就可以忽视时期趋势中的年龄或年龄分布的变化。研究随时间变化的趋势的最保险的办法就是利用分年龄段对比方法。在某个分年龄段对比中,只需要将某年特定年纪的实例与随后某年的同龄人进行比较。这里的年纪可能指代单一的年纪(如15岁),也可能指代一个年龄段(如,超过65岁),并且对所有可能的年龄或年龄组都会做单独比较。例如,Gold和他的同事(Gold和112 华中科技大学硕士学位论文Reimer,1975;Williams和Gold,1972)曾在一个重复横向设计中测试过自我陈述的不良行为,测试对象是从全国概率样本中选出的13-16岁的人群,并发现从1967年到1972年,测试结果几乎都没有变化。Menard(1987a)在1976年到1980年对15-17岁的全国概率样本中选出的人进行调查,也得出了类似的结果。他是通过一个预期追踪研究采集数据的,并且为了把年龄和时期效应区别开来,他每年都只调查15-17岁的人群(在调查的五年内,都只用这个年龄段的人的数据)。CoveyandMenard(1987,1988)对65岁以上人口做了受害和被捕趋势调查,调查发现,随着年龄的增长,他们的受害率逐渐上升,而被捕率逐渐下降。在上述列举的研究中,对受访者年龄的控制相对来说,并没有提供明确的证据表明随着时间的推移,这些趋势是继续存在还是已消失了。如果没有这些年龄控制,即使是对整个人口做调查而不是仅调查某个样本,都很难确定这些变化是历史性的还是发展性的。ChiltonandSpielberger(1971)调查了职务犯罪率的变化,结果发现随时间而产生的大多数明显变化(表面上看来是行为上的变化)都是由年龄结构变化引起的,或者更具体地说,是由青少年在总人口中的比例变化引起的。各个体研究之间会有所不同,但一般情况下,明显的时期趋势可能是由年龄的变化(个体层面上)或是年龄结构(总体层面上)变化引起的这一推测也是合情合理的。变量间的时间趋势关联性。纵向研究的另一个关注点是对变化的检测,并不是检测变量随时间推移而产生的数值或层次变化,而是检测变量间的关联性变化。例如,两个世纪以来,死亡率一直在下降。但在其早期阶段,死亡率下降主要是由公共卫生措施(环境卫生、有权使用安全饮用水、巴氏消毒法,等等)的提高促成的,医药几乎没有发挥任何作用;但在其后期,死亡率的下降主要就是由于医药的进步(如接种、抗生素),而不是公共卫生措施的发展(McKeown,1976;McKeownandRecord,1962;McNeill,1976)。在调查随时间推移而产生的变化强度或关系模式的过程中,一个重要的问题是对以前结果的反复试验,只不过用的是新数据。Elliott等人(1989)采用了连续几年的数据来测试一组因变量的不良行为的理论模型,包括不良行为、吸毒、以及心理健康问题。初期结果显示,该模型能很好解释不良行为和吸毒,但不能很好解释心113 华中科技大学硕士学位论文理健康问题。一般都用相同的受访者的数据,并在一年后再测试。Elliott等成功地验证了第一次测试的结果。保证从上一个时期到下一时期的结果是一样的(实际上是指示结果的可靠性),这种能力可以为该模式提供更多的支持,而一个没有经过反复试验的单个测试却做不到这一点。反复的试验并不总是能够成功,而一段时间内变化强度和关系模式的表现也可能把研究人员引向真正的变化或方法论问题上,比如测量的不稳定或不可靠,或是某个因果模型的错误设定。Menard(1987b)在1970年和1980年对85个欠发达国家的生育模式进行了调查。两个时期的整体模式是非常相似的,但涉及计划生育成就的关系从1970年到1980年就发生了很大的变化,通常来说是相关度越来越小。除了该变化之外,两个时期的模型的结果几乎都是一样的。就像Menard指出的那样,这些变化可能已经反映了计划生育成就测量方面的变化,但在这两个时期测量的计划生育的成就间的强有力关系(Pearson"sr=.83),似乎说明了关系强度方面的真正变化,而不是测量的不可靠性。不论是测量不稳定性或不可靠性的可能性,还是该模型从一个时期到另一个时期整体一致性,都离不开反复的试验。年龄效应:生命周期和发展变化。Baltes和Nessclmade(1979)为纵向研究(对他们来说,更确切地应该说成预期追踪调查研究)列出了五个目标,或者说是基本原理:(1)个体内变化的直接识别,即个体从一个时期到另一个时期是否发生了改变;(2)个体内变化在个体间异同的直接识别,即个体变化是相同的还是不同的;(3)行为变化的相互关系分析,即某些变化是否是彼此相关的;(4)个体内变化的原因或决定因素分析,即个体为何在不同的时期发生变化;(5)个体内变化在个体间异同的原因和决定因素分析,即为何不同个体从一个时期到另一个时期变化的方式是不同的。所有这些目标都与发展变化模式有关,尤其是在个人层面上,尽管它们也很容易扩展到总体层面(团体、组织、城市、国家)。在个人层面上,个体内的变化可能包括人们思考的事情(变得政治上更加保守)、人们做的事情(就业、转业、退休),或是发生在人们身上的事情(被捕或被抢)。在研究个体内变化的时候,年龄代表了心理的变化,并受到一些可能难以直接测量或是直接测量成本较高的社会影响(Hobcraft等,1982)。114 华中科技大学硕士学位论文有时出于某些目的,从横向研究数据中得出一些简单的关于个体内变化的影响也是合理的。例如,从按年龄划分的被捕率和出生率的横向数据中,我们可以合理推断,某人在7岁前被捕或是生育的可能性几乎是零,但这种可能性在青少年和成年早期增加,并在65岁以后大幅降低。如果按时期效应或组群特征来解释这些与年龄相关的差异,结论几乎也是一样的。另一方面,如果要根据横向数据推测人们随着年龄的增长会变得更保守且受到更少的教育,那就不一定正确。如前所述,某一时期不同年龄段的人的政治态度可能反映了其政治态度随年龄的变化,但可能不同组群间的政治态度差异在其整个生命周期内都是恒定不变的。倘若较年长者比年轻人受的教育少,这并不是因为他们“缺乏教育”,更合理的解释应该是教育成果随着时间的推移进步了(时期效应),从而导致了连续组群间的平均受教育水平差异。运用横向数据来研究年龄和行为间的关系的做法促成了一个合成组群的产生,而这在死亡率和出生率的人口学研究中是很常见的。例如,预期寿命和总出生率周期是基于横向死亡率和出生率之上的,但却是通过保险公司(关于预期寿命)及其它组织来推测个人或某个组群随着年龄的增长会发生什么事情。Shryock及Siegel(1934:324)已提出警示,合成组群测量方法的运用需依赖它们能够反映真正组群实际经历的程度(而这只能通过对组群的纵向研究来获得)。在某些情况下,关于发展模式,横向研究和纵向研究可能会得出非常不同的结论。例如,Greenberg(1985)采用的是官方报道的犯罪活动记录,而MenardandElliott(1990a)采用的是自我陈述的不良行为记录,两者都发现,横向研究和纵向研究在衡量年龄与违法行为之间的精确关系可能会得出不同的结论。在某种程度上,纵向研究和横向研究的结果差异可能是由组群规模效应产生的(Elliott等,1989:107-109;Menard和Elliott,1990b)。如果我们想要研究行为的“职业”模式,就更需要用到纵向数据。纵向数据一个最为明显的应用是在劳动市场研究方面,从最初的进入职场,到随后的晋升、工作变动、失业、直到最后的退休或死亡。与此密切相关的是职业成就的研究,这包括教育程度、职业地位和收入水平(如,Blau和Duncan,1966)。该“职业”角度的其它应用包括婚姻记录(如Becker等,1977)、教育程度和学习过程(如,Heyns,115 华中科技大学硕士学位论文1978),以及犯罪经历(如Blumstein等,1986)。这些研究的一个共同关注点是行为开始、持续、及结束的职业模式,以及与行为变化或间断(失业和重新就业;离婚和再婚;辍学和再教育;犯罪行为的中止和重新开始)有关的相关及潜在原因。只有通过纵向数据以及更加具体的追踪调查数据,关于发展进程模式的许多问题才能得到解决。纵向数据在实验研究和评价研究方面也发挥着重要作用。大多数实验设计和准实验设计本质上都是纵向的,它们的测量在实验处理之前(预测)和之后(事后测量)都有进行,同时为了确定事后测量的偏差是由于实验处理造成的、还是由于实验处理和控制组之前就存在的偏差造成的,期间也会有干预(Campbell和Stanley,1963)。在进行实验设计时,即使在不进行预测的情况下,研究人员仍能预设出受访者随机分配到不同的实验处理过程的结果,要么是受试群体内没有任何重要的变量不同,要么就是受访者的差异受制于已知的统计分布。甚至,一个只有事后测试的实验设计也包括一个关键的纵向假定,那就是,事后测试的实验组和控制组的差异代表了从预测开始的一种变化,而据推测,在预测阶段,实验组和控制组是没有差异或只有微小差异的(虽然这并不能证明也不能反证)。同样,预测和基准数据往往是在评价研究中获得的(Rossi和Freeman,1989)。倘若没有预测或基准数据,那么就不能确定实验处理或干预后的差异究竟是全部由实验处理或干预导致的、还是也与接受了实验处理和干预的群体和未受实验处理和干预的群体事先就存在的差异有关。变量间关系的发展趋势。早期我们关注检测强度和关系模式从一个时期到下一个时期的变化,以此类推,我们可能也希望能检测强度和关系模式从一个年龄段到下一个年龄段的变化。这里又得考虑一个问题:是基于横向(组群内的)数据比较还是基于纵向(组群间的)数据比较。与之前一样,这取决于我们是否关注横向数据反映发展变化的程度。如果要采用纵向数据,任何变化的产生都得考虑是否与年龄、时期或组群效应有关。在对新泽西州的341位青少年男生的调查中,LaGrange和White(1985)发现,对于较为年长者(18岁的)和年少者(12岁的)的青少年男生来说,只有一个变量116 华中科技大学硕士学位论文对其不良行为有重大影响,那就是与不良朋友的关联程度。然而,对于15岁的男生来说,家庭和学校这两个变量也影响其不良行为,有时候比不良朋友的影响还要大。尽管他们的样本规模小,而且限于特定年龄段的子样本更小(三个年龄段都只有81到138个实例),他们的研究还是提出了重要的一点—多元因果分析的结果可能会各有不同,至少是在关系强度方面,要取决于样本的受访者年龄。因为他们的数据是横向的(在同一年对不同年龄组进行测量),所以就不能排除另一种可能性:差异的产生可能并不是与具体的年龄有关,而是与所选的具体组群相关。要解决该问题需要进行反复试验,而且最好是采用纵向数据。Menard等人(1989)采用了国家青年调查的数据,对1976年11-17岁而1986年为21-27岁的同一组群进行了一个预期纵向追踪调查,结果表明,在青春期,婚姻与吸毒、精神健康问题呈正相关,而在青年时期(21-27岁)却与吸毒和精神健康问题呈负相关。在青春期,入学与违法行为、吸毒和精神健康问题呈负相关,但在青年时期,入学与违法行为、吸毒和精神健康问题没有相关性。Wofford(1989)对相同的样本进行了调查,结果表明,在青春期,就业率与严重违法行为的较高概率有关,而在青年时期(在本研究中是18-24岁)却与严重违法行为的较低概念相关。实质上,这些结果还有待解释说明。对于特定年龄组来说,有可能存在特定的行为规范(上学、婚姻、工作方面),而违反这些规范就会使某人更容易产生违法或其它不良行为。就方法论上来说,这些结果表明,变量间的关系会改变生命周期过程,所以测试这些变化是否存在就显得合理而恰当。如果采用横向数据,这些差异可能会归因于年龄或组群内差异;倘若采用基于多个组群的纵向数据,就可以对照时期差异或组群内差异来评估发展性差异的程度。因果关系为了建立不同变量间的因果关系,以下三个条件是必须的(Asher,1976;Baltes和Nesselroade,1979:35;Blalock,1964;Williamson等,1982:218-219):(1)所讨论的现象或变量应共变,例如,实验组和控制组间的差异或两个变量间的非零相关性;(2)该因果关系不能归因于任何一个或一组变量,即不能是伪造的,即便其它变量受控,关系仍然存在。例如,实验设计中的随机选择(实验组和控制组在117 华中科技大学硕士学位论文实验处理前是没有差异的),或是当其它变量保持恒定时,两个变量之间的偏相关性不为零;(3)假定原因应先于、或与假定结果同时发生,也就是说,原因的变化不会比结果更晚出现。前两个条件可以通过纯粹的横向数据或是时间顺序的横向数据达到。第三个条件通常只能通过纵向数据充分测试获得。唯一的例外就是变量的生物或遗传特征(性别、种族)所产生的影响。对于这些变量,我们可以放心地采取时间顺序,而不用采用纵向数据,因为实际上,如果某一固定的或遗传性的特征被认为是一个变量特征的原因的话(政治态度、违法行为),我们得到的数据至少部分上是有时间顺序的;而且我们也知道,固定特征总是先发生。换句话说,固定生物特征或遗传特征的衡量可以在某一特定时期进行,但它适用于出生后的所有时期。如果可能存在非递归因果关系的话,情况会变得更加复杂。在一些理论里,因果关系不仅影响从X到Y的传递,还影响Y到X的传递。例如,Malthus(Appleman,1976)就猜测,(1)人均粮食供给的增加会导致出生率的提高,(2)出生率的提高会导致人均粮食供给的下降。倘若只有横向数据,那么,则不能就特定方向因果关系的先验性消除达成一致意见,关于二元关系的因果顺序或方向的问题也就得不到解决(Blalock,1962;Heise,1975;Simon,1954)。马尔萨斯理论中已提到(如前所述),如果存在一个包括负反馈环的非递归因果关系模式,那么仅用横向数据,甚至是用两到三个阶段的最小二乘法或其它相当复杂的数据分析方法,充分建模都还是非常困难的。但如果有纵向追踪数据(重复横向数据在此还是不够),那么因果顺序的问题就更有可能得到解决,而且还可以测试两个方向的因果影响。(虽然是很有可能,但逻辑上并不能保证纵向数据能使交互效应的可靠估计成为可能;例如,测量时期可能无法精确地把某一变量的变化与另一变量的变化分离开来,从而解决不确定的排序问题。)在马尔萨斯理论的例子中,因为存在负反馈环,对该理论的充分测试就需要相当长时间的系列数据。能够识别相互因果作用的因果方向辨认方法之一是线性追踪分析,在这点上,Kessler和Greenberg(1981)作了广泛讨论。Menard(1990)运用线性追踪分析,并在出生率、死亡率、计划生育成就和经济发展之间关系的不同理论背景下,对交互效应进行了测试。在对一系列模型进行测量的过程中,每个变量都依次作为了因变118 华中科技大学硕士学位论文量,而且在测量因变量(包括滞后内衍变量,即在之前测量的因变量)之前会对所有的变量进行一次测量,所有的变量都可作为因变量预测。在此框架内,可以通过横向数据检测每个变量对其它变量影响作用的可能性。把内衍变量纳入方程式有助于控制不可测变量的影响,并可为(非零)因果关系的存在性提供一个相对保守的测试。Menard发现了以前横向出生率模型中未包括的相互因果关系,也发现了可以证明以往研究中使用的假定因果顺序可能出错的证据(即那些模型可能是错定的)。这些发现尤其有用,因为他们论述的是不断变化着的变量间的关系问题,而且可能也很难确定这些关系的真正时间顺序(如,一个国家不是在某些明确时间“启动”出生率或经济发展的;出生率和经济发展两者都是在国家存在的整个时间段内不断发生的,不能说是其中一个在另一个之前“开始”)。需要注意的是,在这种分析类型中所确定的交互效应并不是瞬间发生的,而是存在时间滞后的。每个模型(对每个因变量进行估计)在技术上都是递归的,因为它们不是“瞬间发生的”交互效应;只有通过结合各个因变量模型的结果,我们才可能推断双向或非递归因果影响的存在性。真正的时间顺序和因果关系。在某些情况下,有可能识别两个变量的明显“开始”,并确定两者之间的真正时间顺序。在这些情况下,人们未必可以推断第一个变量的变化会导致第二个变量变化(共变和伪关系的条件还是必须满足的),但这样的测试可以证明第二个变量的变化不会导致第一个变量变化。Elliott(1989)和Huizinga等(1989)调查了违法行为和吸毒之间的关系并得出结论,如果其中一个变量导致了另一个变量的发生,那么更有可能是违法行为导致了吸毒,而不是吸毒导致违法行为。所有同时有违法行为(不包括酗酒、吸大麻和严重吸毒)和酗酒的受访者都是先发生违法行为的;所有同时有违法行为和吸大麻的受访者都是先发生违法行为的;而且所有同时有违法行为和严重吸毒行为的受访者都是先发生违法行为的。如果原因必须发生在结果之前的话,那么酗酒和吸毒很大程度上就是违法行为发生的原因。最合理的结论是,要么是违法行为导致了酗酒和吸毒;要么是违法行为和吸毒有相同的原因(即该关系是虚假的),而且因为这种种原因,违法行为往往发生在酗酒或吸毒之前。根据Elliott等(1985,1989)提供的证据,后一个解释(虚119 华中科技大学硕士学位论文假关系)似乎更有可能。在一个相关研究中,Menard和Elliott(1990a)测试了两个理论:其一:认为与不良朋友的交往导致了不良行为,其二:认为不良行为导致了与不良朋友的交往。他们发现,与不良朋友的交往通常都发生在参与不良行为之前,从而证明了前一个理论(学习论)而否定了第二个理论(控制论)。此外,建立时间顺序本身并不足以建立因果关系,但它确实证明了其中一个因果关系的合理性,并否定了另一个因果关系。因果分析中的其它问题。除了解决因果顺序和交互效应存在性的问题之外,纵向数据和分析连同因果模型,可用于调查行为的长期和短期影响差异。McCord(1983)发现,儿童时期的侵略性、父母的侵略性、父母的控制和父母的影响对其成年时期的攻击性和反社会行为有长期的影响。作为学前教育项目先驱的佩里学前教育项目(Berrueta-Clement等,1984;Schweinhart和Weikart,1980;Weikart等,1978)发现,学生行为和学习的短期影响似乎在之后的几年中消失了,但在进入青春期后又变身长期影响再度出现。有了诸如时间史分析(Allison,1984)这样的方法,在给定适当数据的前提下,直接把年龄效应、时期效应与因果分析结合起来以解释发展性和历史性变化则显得更为容易。这些例子都属于变化描述和因果中更广泛的分析范畴,但他们表明了,关于变化和因果关系的问题有时可能比变化是否发生及为何发生这样的简单问题更为复杂(长期变化对比短期变化;变化率的因果影响)。已提出的问题类型可能具有重要的意义,但在这些可能性当中,纵向设计对于特定研究是最为适合的。纵向数据的偶然性和指向性最早的社会科学纵向数据是人口普查数据,它最初可能并不是用于衡量变化、或是确定因果关系的方向或量级的。通常,早期人口普查的两大目标是征兵和课税(Thomlinson,1976)。随后,在美国,人口普查的唯一本质目的是分配议员名额。最近几年,人口普查数据也被用来作为联邦政府向各个州拨款的依据。人口普查数据可用于衡量变化以及推断历史因果关系,这个事实的偶然性要大于其指向性,至少直到最近几年都是如此。其它的纵向数据来源也面临同样的情况。在20世纪,尤其是二战以来,由于政府和科学界对社会科学研究、特别是纵向研究给予了更高的120 华中科技大学硕士学位论文重视,人们更加有意识地去收集纵向数据用以分析变化和因果关系。尽管如此,纵向研究仍是政府机构收集多数周期性数据的第二大原因,而不是最主要的原因。因此,收集数据和定义变量的方式会各有不同,从而导致不同时期的数据没有完全的可比性。例如,在人口统计方面,联合国一直致力于为婴儿死亡人数和婴儿死亡率设置计量标准。除了国际标准的应用问题,还有一个问题便是:诸如1960年的瑞典和1975年的西班牙(Hartford,1984)等国家在执行上述标准时,其数据是不连续的,以至于某些时期内(如从1970年到1980年的西班牙)的婴儿死亡率的比较是不精确且有问题的。记录的完整性和对发生事件的计量可能会随时间而变化,而这会使对给变化测量带来更大的问题。总统法律实施和司法管理委员会(1967)曾做出警告,美国农村地区的问题使得联邦调查局在1958年之前公布的犯罪数据(每年一次)与其后几年公布的数据“既不完全匹配,也几乎不可靠”。如果从一开始就采用纵向研究方法收集数据,那么,这样的问题就更能得到充分的解决。但值得注意的是,如果研究人员意外获得了一开始是用于其它目的的数据,那么在用于纵向研究之前,一定要仔细审核。分析单元或事件的定义和计量的变化、或是实例充分采样的程度变化,这些都可能使一些数据集不适合用于纵向研究。3.纵向数据收集方法非典型纵向设计在第一章中,我们把纵向研究与每个实例的每一变量的数据都与只同时收集一次的纯粹的横向研究进行了对比。同时还对预期追踪设计、回溯追踪设计和重复横向设计进行了描述。有些研究并不局限于纵向研究或者纯粹的横向研究的定义。Ahluwalia(1974,1976)运用人均国民生产总值和收入差距的数据来调查收入差距和经济发展之间的关系。因为收入差距的数据是零星收集的,于是Ahluwalia便采用了每一实例在同一时间收集的收入差距和人均国民生产总值数据,但这些数据是不同国家(实例)不同年份的数据(如某一国家的这两个变量是在1955年收集的,而另一国家的这两个数据是在1972年收集的)。通过一个跨度18年(1965-1972)之久的单一横向数据研究,Ahluwalia隐射地假设这18年构成了一个单一的时期。121 华中科技大学硕士学位论文也就是说,该方法假设人均国民生产总值和收入差距两者的数据是恒定的(在数值上,或者至少关于这些变量的国家排名上没有重大变化),至少这些变量的关系在这18年里基本上是不变的。做出这样的假设事先应慎重考虑,最好是佐以实证性支持。与该稳定性假设相反,Menard(1983,1986)证明了Ahluwalia收集数据的时期内,根据收入差距排序的国家次序是变化的,以此说明随着时间的推移,收入差距是不稳定的。而与此同时,人均国民生产总值保持稳定。实际上,Ahluwalia的数据可能代表了一系列的横向研究数据,它们重复测量相同的变量,但其不同时期的实例既没有可比性也不尽相同。横向数据的收集时期持续得如此之久,人们有理由相信,所有实例的测量可以算是同时进行的。略有不同的是,Tolnay及Christenson(1984)特意选取了不同时期测量的变量,以对出生率、计划生育和发展的因果关系进行路径分析。所有国家的各个变量都是同时测量的,但不同变量测量的时间不同,以便把测量的时间次序与路径模型的因果关系次序匹配起来。而这与Ahluwalia的数据收集方法恰恰相反。对Ahluwalia来说,每个实例的变量都是在同一时间测量的,但不同实例的测量时间不同;而对Tolnay及Christenson来说,每个变量的实例都是在同一时间测量的,但不同变量的测量时间不同。尽管不同变量的测量时间不同,但每个实例的每个变量只测量一次,而且这些数据没办法用于最简单的真正的纵向分析(测量某一变量从一个时期到下一个时期的变化)。Tolnay及Christenson采用的分析实质上是横向分析。如果他们选择假定瞬时效应,那么纯粹的横向数据与他们的分析刚好可以匹配。对于他们的分析来说(评估计划生育工作和出生率发展的直接和间接影响),他们的设计是合理的,并且可能比那些路径模式的因果次序和测量的时间次序不一致的模式更有优势(MenardandElliott,1990a)。结合时间次序数据和横向分析,Tolnay及Christenson运用的设计可被视作为时间次序横向设计。正如Tolnay及Christenson(1984)采用的时间次序横向数据一样,它是时间次序一建立起来就需要的,但它并不足以确保人们不通过结果“预测”其原因。例如,假设X和Y两个变量的真正因果关系是如图3.1描述的一样。X先前的数值会影响X其后的数值;Y先前的数值会影响Y其后的数值;Y先前的数值会影响X其后的122 华中科技大学硕士学位论文数值-----也就是说,Y是有限的时间滞后效应对X造成影响的一个原因。然而,假设我们误认为X是Y的原因,而且我们在一个时间次序横向设计中把X2当作是Y3的原因,但不包括其它的X(X1andX3)和Y(Y1andY2)。尽管我们认为的因果次序是错误的,但如果只因为Y1直接影响X2,而Y1间接影响(通过Y2)Y3,我们可能会发现X2和Y3之间的关系。如果随着时间的推移,变量变化相对较慢(即,如果它们是相对恒定的话),那么不管我们比较X2和Y3、X3和Y2、还是两个变量的一些纯粹的横向数据组合(如X2和Y2),我们都会得出类似的相关性结论。只有通过真正的纵向设计(如预期追踪设计)和分析,我们才有可能确定变量X和Y之间的真正的因果关系。图3.1X和Y的假定因果关系X与Y的关系。原则上,滞后性内衍变量的两波段线性追踪分析能够探测Y会影响X、而X不影响Y的这个事实(如Menard,1990)。如果采用横向数据,甚至是时间次序横向数据,因为对该模型不正确的因果次序估计,人们可能还是发现不了其中的错误设定。而采用诸如时间次序分析或追踪分析这样的纵向数据的话,不正确的因果次序就更容易被检测到,因而模型也可以得到纠正。总人口设计图3.2展示了四种类型的纵向设计。在图3.2中,水平方向代表数据收集的时期(一个月、一年、或是十年),垂直方向代表数据收集的实例(人口或是样本)。在一个总人口设计中,在每一研究时期都会调查并测量总人口。因为不同时期会有一些个体死亡,也有其他个体出生,所以实例是不同的;但如果时间跨度较短,不同时期内的绝大多数实例还是相同的。举例来说,美国十年一次的人口普查致力于收集美国总人口的年龄、性别、人种、住处,其准确度为95-99%(Robey,1989)。联邦调查局的犯罪统计表致力于收集特定犯罪行为和有限犯罪行为集合遭逮捕的数据、警方获悉的犯罪行为、以及美国所有警区被捕者的年龄、性别、人种和居住地(城市、郊区还是农村)方面的数据,尽管其覆盖范围相对较低,但仍有相当大的准确性和完整性。不论是基于何种数据收集方法,总人口设计在实例流失和测量误差方面都可能123 华中科技大学硕士学位论文存在问题。因为设计中包括总人口,因此该设计应能够适用于测量或推测时期发展趋势,但要想澄清这些趋势的性质,就有必要先对年龄效应和组群效应(上文已提到)进行仔细检测。例如,逮捕数量和逮捕率的明显变化可以反映人口构成方面的变化(倾向于青少年阶段的比例),而不是个体或群体行为的变化(Chiiton和Spielberger,1971)。因此,年龄效应、时期效应和组群效应的分离不论是对总人口设计还是对其它类型的设计都是个问题,但就这一点,该设计没有特别的问题。发展性变化既可通过横向获得(跨组群的特定年份内),也可通过纵向获得(跨年份的特定组群内,如果有足够的时期来检测上述发展性变化的话),而且两种方法的评估发展性效应的结果可能会有可比性。如果可以选择适当的时期、组群或其它分组人口,任何类型的纵向分析都可用于总人口设计中的数据收集,当然,条件还是有足够的独立时期来运用特定的方法。例如,线性追踪设计通常只需要两到三个时期(Kessler和Greenberg,1981),但ARIMA时间序列模型原则上是需要至少50个不同时期的50个观察结果(Box和Jenkins,1970:18;McCleary和Hay,1980:20)。图3.2中的其它三类纵向设计都需要用到总人口中提取的样本,所以其实是总人口设计的子集。三类设计的不同之处在于,不同时期对于相同的或有可比性的实例的研究程度。这种区别对于各种设计应采用何种纵向分析具有重要意义。重复横向设计在重复横向设计中,研究人员通常是在不同的测量时期获取独立的概率抽样。这些样本通常应包括各个时期的所有不同的实例集合,否则会造成样本重复的概率过小以致于几乎可以忽略不计;但是从一个时期到下一个时期的所用的实例应是具有可比性的,就像在总人口设计中的一样。重复横向设计的一个例子就是MartinGold和他的同事进行的全国青年调查(Gold和Reimer,1975;Williams和Gold,1972)。Gold和他的同事分别在1967和1972两年收集两个国家青年概率样本的数据。从这些样本中,他们得以推测,尽管从1967到1972年未成年人遭逮捕率的确有所变化,但这一时期的自我陈述不良行为几乎没有发生实际变化。Johnston等(一年一度)收集了1975年以来的高中生全国概率抽样数据。正如Gold及其同事收集的数据一样,他们的重复横向数据使测量某一特定年龄群体的观点和行为随时间变化的趋势124 华中科技大学硕士学位论文成为可能。(纵向预期追踪数据也可从监测未来研究中的子样本中获得,这些子样本是从原先的高中生样本中抽取出来的。)重复横向研究的主要限制在于其不适合研究组群内的发展模式,以及不能解决因果次序的问题。这些限制是由这个事实直接造成的,即,在重复横向设计中,相同的实例不是反复测量的,也不会在多个时期重复测量。发展模式可以通过观察不同测量时期多个组群的测量数据这样的跨年龄段(即跨组群)的差异获得,但重复横向设计相较纯粹的横向设计的唯一优势在于,重复横向设计可以在不同时期建立相同的横向数据结果。这会降低(但不会消除)该种可能性,即,组群内比较显示的发展模式或许不能反映组群间比较得出的发展模式。对于因果次序来说,相同实例的两个或两个以上时间段数据的缺失则意味着时间次序分析和线性追踪分析都不可能进行(除非有适当的方法能够对比不同时期内测量的不同实例,而这几乎是不太可能的)。重复横向设计中的样本或子样本变化测量只能在总体水平上进行(如男性和女性,族群,社会阶层)。该变化测量不能在个体实例层面进行。诸如此类的限制使得许多作者、特别是发展心理学(如Baltes和Nesselroade,1979)方面的作者认为重复横向设计不能被归属于纵向设计范畴内。但是,Baltes等(1979)在组群效应研究中仍会考虑重复横向设计(他们将其描述为横向序列)。重复横向设计普遍适用于对总体时期趋势的测量。如若因果次序已建立,且假设原因和结果间的时间滞后相对于测量时期间的间隔来说是较短的,那么重复横向设计也可用于模型间的因果分析,它们在本质上也是横向的。如果组群内的和组群间的发展差异有着密切相关性,那么采用多组群的重复横向设计来分析发展模式就没有什么困难,同样,这其实也是横向分析。对于因果推理和发展性分析来说,可能会需要用到其它类型的纵向设计来检测重复横向设计运用的合理性。最后,重复横向设计使得研究人员可以在不同的时期得到相同的横向数据结果。不过,如果我们对组群间的发展变化或是确定因果次序感兴趣的话,运用其它类型的纵向设计来进行数据收集可能会更适合。循环追踪设计循环追踪设计回顾性或前瞻性地针对一系列样本案例在某些特定的测量时期进125 华中科技大学硕士学位论文行数据收集,接着会剔除一些受访者并代之以新的受访者。循环追踪设计可以减少前瞻性研究中的追踪死亡率和重复测量问题(接下来就会讨论到),也可以减少回顾性研究中所可能出现的延长召回期间的问题。在一些测量时期内保留某一特定实例集合可以便于分析个体或实例层面的短期测量变化、组群间的发展变化短期分析、以及追踪分析。而在某个测量期间除去一些子样本并代之以新的但具可比性的实例子样本,这样便于对总体变化的长期模式进行研究。如若原因和结果间的时间滞后比实例在样本中保留的时间(时期)要短,那么就可以对时间和因果次序进行分析。对一些实例进行重复测量得出的纵向数据,结合以不对其它实例进行重复测量的数据,这种数据组合便于比较验证重复测量是否会产生任何的数据偏差(如,在建立起一定程度的信任、或是发现报告可能会导致冗长而乏味的后续问题时,这种报告的意愿是会增强还是减弱)。由美国司法部出资、人口普查局进行实施的全国犯罪调查就是一个很好的循环追踪设计的例子。在这个调查中,家庭成员定期接受采访,采访内容是关于其成员遭受七种攻击行为(强奸、抢劫、严重袭击、轻微人身攻击、入室盗窃、偷盗和机动车盗窃)的犯罪侵害。各家各户都被列入概率抽样选择中,并接受为期3年的7次(以6个月为一次时间间隔)采访,接着就除去该样本,代之以新入选的家庭。该项研究以家庭为分析单位,这不仅使得对于家庭成员内部的受害率短期趋势的分析成为可能,还能够分析受害率的短期和长期趋势的总体水平和平均值。然而,还是不能对家庭成员内部的长期发展趋势进行分析。堪萨斯城的警察巡逻实验(Kelling等,1947)也是采用了循环追踪设计来收集受害数据。在预测中选用了一个涵盖1200个家庭的样本,并在后续测量中保留了一半的样本,另一半代之以其它的样本。因此,就可以对那些被采访过两次的人(预测和后续测量)和那些只被采访过一次的(只在后续测量中)进行对比,并排除这种可能性,即该结果(控制组和实验组的警察负责区之间没有区别)是重复受访偏差造成的影响。循环追踪设计还可用于对特定年龄范围内的个体(如青少年,或是65岁以上的人士)进行纵向研究,以避免诸如受访者“年龄超出了”青春期,或是年老死亡之类的样本损耗造成的严重问题。有限年龄范围内的循环样本使得研究人126 华中科技大学硕士学位论文员能够保有充足数量的实例(参看Kraemer和Thiemann,1987),以在更大样本内进行小样本子集的复杂分析。纵向追踪设计在纵向追踪设计中,每个时期采用的都是相同的实例集合。实际上,由于数据缺失,不同时期可能会出现一些变化。例如,实例是个人时,有些个人从一个测量周期到下一测量周期可能死亡了,而有些会不再愿意合作,还有些人会搬到研究人员找不到的新地方。所有这些都是追踪损耗的根源,对于那些数据收集是在不止一个时期内进行的预期追踪设计来说,更是如此。正因如此,追踪损耗对回溯追踪设计并不构成问题,因为它的数据收集只在一个时期内进行一次;追踪损耗只对需要在两个或两个以上时期内进行数据收集的设计有影响(在数据收集时期内或之前)。然而,在回溯追踪设计中,因为不包括在最后一个数据收集周期内死亡的受访者,或者因为有些受访者前期能收集到数据、后期收集不到数据,抽样上可能也会出现偏差。在回溯追踪设计和预期追踪设计中,数据丢失可能有以下原因:受访者不能够回忆起过去的事件、行为、观点,或受访者不愿透露一些信息,或者是研究人员不能让受访者保持合作。原则上,回溯追踪设计和预期追踪设计的数据质量不会有任何差异,但差异实际上总是会出现(如第4章所述)。在时间周期和组群数量充足的条件下,涵盖多个组群的纵向追踪设计(如图3.2所示)应能够进行任何类型的纵向分析。单个组群追踪设计不能对不同组群进行对比研究,但多组群设计可以对年龄效应、时期效应和组群效应进行分析;对发展性变化和历史性变化进行描述;对事件时间次序进行分析;进行线性追踪分析;以及因果关系分析。例如,DelbertS.Elliott及其同事(Elliott等,1983,1985,1989)进行的全国青年调查在1976年选取了11-17岁(7个组群)的国家青少年概率样本进行调查,并对同一样本定期持续调查,最近的一次是在1990年。国家青年调查的数据被用于多种用途:估算和分析违法行为的时期趋势(Menard,1987a);区分吸毒(Elliott等,1989;Menard和Huizinga,1989)和违法行为(Elliott等,1989;Menard和Huizinga,1990b)的年龄、时期和组群效应;测试和复制青年时期违法行为的理论模型(Elliott等,1985,1989);确定变量的时间次序以解决竞争理论127 华中科技大学硕士学位论文提出的对立主张(Menard和Elliott,1990a)。这些例子说明了多组群预期追踪的数据分析和结果的广度。其它设计变体图3.2所示的设计方法并不是纵向研究的唯一可行方法。例如,一个循环样本中的一个子样本可能会在某一时期内被除去,然后在下一个时期内重新纳入样本中。也有可能在某一追踪设计中,只要满足特定的条件(如年龄为21岁),某些实例会被直接丢弃而没有替代实例。后一个设计会导致样本规模单调递减,有可能会对未来研究的数据分析造成消极的影响。然而,与数据收集各种设计方法相关的一般考虑不应改变,图3.2呈现了四种设计类型的修改版本,并且这些基本设计的变化需基于以下因素进行评估:描述短期和长期历史趋势的准确性(时期效应);描述组群内和组群间的发展变化(年龄效应);区分年龄、时期和组群效应;确定因果关系影响的强度和方向(如,通过时间次序分析或者线性追踪分析)。只要有充足数量的组群和测量期间,总人口设计和纵向追踪设计都可用于实际的任何类型的纵向分析。其它设计则比较有限,它们的适用性得根据具体的研究问题而定。在上述每个设计中,实例和时期数量可能会有所不同,基于这些不同,在分析的时候就需要用到不同的方法。如果实例和时期的数量都很多(如,有数千个实例,以及100个或更多的时期),那么分析的可能性就只决定于数据的质量。如果实例和时期的数量都很少(如,跨越2-10个时期的1-10个实例),那么进行任何的定量分析都可能是有问题的。更典型的是,实例的数量可能会相当多(如,个人层面的1000个实例,或是总体层面的50个实例),而时期的数量可能很少(2-4个),这种情况下,线性追踪分析(Kessler和Greenberg,1981)就是一种合适的方法。另外,有时实例的数量可能很少(1-10个),而时期的数量却很多(50个或以上),这种情况就适合采用时间序列分析(McCleary和Hay,1980;Wei,1990)。实例的数量原则上是独立于设计类型的。例如,在某一个人层面的总人口设计中,其组群总人口数可能会少于100。在总体分析中,其分析单位应为组群或总人口,而不是个体成员,而且这些总体单位的数量可能很少。另一极端例子是全国犯罪调查的循环样本,它涵盖了来自6万个家庭的10多万人。所有这些设计类型和实例数量的可能组合都包128 华中科技大学硕士学位论文括在纵向研究的广泛范畴内。4.纵向研究问题用于纵向研究数据收集的方法并无任何独特之处。就像横向研究一样,纵向研究也依赖于收集数据的三个基本方法:问受访者问题,观察受访者的行为,以及观察受访者行为的物理痕迹或结果。数据收集可能会基于一个实例、少数实例、或是相当大数量的实例;也可能是基于某一群体内的所有人、群体的一个概率抽样、或是可能或不能反映群体整体或群体某些部分的特定的个人。数据可能会在个体层面保存并编码,或是汇总成家庭、人口普查或是国家。数据收集的时期可能会比较短,如几个小时,或是更长些,如几年。过程中可能会用到标准化的数据收集工具,或者说,数据收集对于每个实例来说都是独一无二的互动过程。纵向研究和横向研究都会涉及案例研究、人种学、实验、抽样调查、人口普查、或是归档数据收集。如前所述,纵向数据收集和横向数据收集的主要区别在于:在纵向研究中,每个变量数据的收集都需跨越至少两个时期。由于质疑横向研究的数据质量,人们于是纷纷转向了纵向研究。与横向研究类似,在纵向研究中,下列问题都是很重要的:内外部测量的有效性;测量的可靠性;抽样;对研究中的人口提问的合理性;实验设计中随机程度的妥善性;被试者或是受访者与实验者、采访者或是观察员的互动效果(在微观社会学数据收集中);研究的相关性问题(我们测量的是重要的东西,还是容易被测量的东西?);以及研究成本。上述的这些问题中,有些对纵向研究更构成问题,而不是横向研究。例如,取样偏差可能在重复横向设计中被放大,或者在预期追踪设计中,通过研究人员与受访者的重复接触,其对受访者的影响可能会被放大。对于这些问题的一般性讨论可以参看其它典籍(如Babble,1989;Bailey,1987;Williamson等,1982)。本书的重点放在纵向研究中常出现的典型问题和困难上,而不是横向研究。成因与预测Zazzo(1967)认为,应该对行为成因的研究和行为预测的研究进行区分。在Zazzo看来,预测研究关注的是人口特征随着时间推移的稳定性,以及外部影响(环境和介入性干预的变化)改变这些特征的程度。相比之下;成因研究则侧重于质变的阶129 华中科技大学硕士学位论文段和顺序,其目标是发现发展和变化的规律。根据Zazzo的观点,对于行为成因的研究需要使用更加定性的方法:应摒弃大样本、预定假设和变量,转而利于小规模实例进行深入研究,研究之初没有预定假设何种变量重要,并且不应把年龄(以及年代时间)看作是一个连续体,因为其在衡量变化时会参照其之前的状态。Zazzo引用了Piaget的著作(参见Piaget1948,1951,1952)来作为成因研究的一个例子。不可否认,大多数纵向研究的重点都放在预测研究上而不是成因研究上(正如Zazzo定义的一样)。然而,我们仍注意到,不论是宏观社会学层面还是微观社会学层面,对于成因的研究尚未被忽视。在宏观社会学层面,Rostow(1960)提出了一个经济发展阶段理论,Black(1966)致力于定义政治发展或是政治现代化的阶段,还包括人口过渡理论及其各种变体(如Caidwell,1976;Davis,1963;Notestein,1945;Thompson,1929),虽然也不乏批评者(VandeWalle和Knodel,1980),但它仍是大量人口统计学研究经久不衰的研究角度(参见Menard,1990;Tolnay和Christenson,1984)。在微观社会学层面,Kandel及其同事(Kandel,1975;Kandel和Faust,1975;Kandel和Logan,1984;Yamaguchi和Kandel,1984a,1984b)已对吸毒的阶段顺序进行调查,并发现了从酗酒到吸食大麻再到其它非法药物的进程的证据,受访者一般都需经历较早(不太严重的)阶段,再进入更深层次的阶段。其他研究人员已证实了Kandel的研究发现(Huizinga等,1989)。Kandel的研究还表明,对行为成因的研究不应孤立于预测研究。她和她的同事不仅描述了吸毒的进程顺序,还解释了在何种情况下,一个阶段向另一阶段的过渡最有可能发生。那么,为了获得发展模式更完整的记录,我们可以对一个阶段向另一阶段过渡的有关的行为顺序和发生时间进行研究。测量方法随时间的变化在1930年,Redfield(1930)发表了他在一个叫做迪坡斯特兰的墨西哥小村庄进行的民族志研究结果。其中,他描述的村庄是和谐的、那里的人民既适应环境也自足自乐。21年后,Lewis(1951)发表了对同一村庄的民族志研究结果,与Redfield恰恰相反,Lewis发现不论是该村庄内、还是该村庄与其它村庄之间,都有暴力、虐待和冲突的大量存在(GistandFava,1974:513)。同样,在Mead(1928)发表了130 华中科技大学硕士学位论文她对萨摩亚民族志的研究发现的55年后,Freeman(1983)通过他自己对萨摩亚的民族志研究,对Mead的研究结果提出了质疑和反对。由于时间上的差异,目前还不清楚结果的差异究竟是反映了真实的变化,还是研究人员不同的偏见或定位。不同的民族志研究所面临的问题可能也会出现在其它的调查研究当中。Martin(1983)描述了重复横向调查设计未能成功复制对受害率及对美国高校信心的调查。关于受害调查,城市研究所根据人口普查局进行全国犯罪调查运用的标准程序,专门复制了一个同样的调查,其得到的受害率结果还不到一年后对同一可比人口进行的全国犯罪调查获得的数据的一半,同时也低于同一时期进行的一个电话调查获得的数据。关于对美国高校的信心,哈里斯民意调查和全国民意研究中心采用的是几乎相同的方法,不过,不仅两者获得的横向结果不同,两者得出的发展趋势也不一样。相比之下,Gold(Gold和Reimer,1975;Williams和Gold,1972)对于不良行为的重复横向研究在复制从第一波到第二波的抽样程序和实质性结果方面似乎更为成功。由Gold及其同事进行的调查的优势之一是她们拥有出色的研究人员。如果未能深入了解正式的研究程序及研究的非正式方面,那么,想要在一个重复横向设计或是预期(总人口、循环追踪、纵向追踪)的纵向设计中完全复制前面波段的数据收集结果是非常困难或是不可能的。对于不同的数据收集方法,跨时期或跨波段的数据收集标准化问题也可能有所不同。调查研究中的跨波段标准化通过不同数据波段的相同问卷得以辅助实现,但不同波段的采访者管理问卷的方式变化可能也会构成问题;而这主要是个有关采访者培训的问题。对于更多的定性研究来说,数据收集“工具”可能是观察员,而不同的观察员可能有不同的倾向,侧重于特定环境的不同方面或是特定环境内的行为,由此会产生非常不同的结论。一些研究人员认为,参与式观察研究的发现可能本质上就是“特别而难以复制的”(Blalock和Blalock,1982:97)。不同时期的数据收集缺乏标准化也是情有可原的。如果某项调查最初的受访者是青少年,继而对其跟踪调查到他们20多岁或30岁初,那么他们在调查早期对于学校的喜爱程度就很重要,而他们在调查末期对于他们的工作和职位的认可度可能131 华中科技大学硕士学位论文更为重要。受访者也将面临从原始家庭(父母和兄弟姐妹)向延生家庭(配偶和子女)的转变。如果关于工作、学校和家庭压力的态度是一些行为(如吸毒)理论上的重要预测因子,那么比较受访者的生活变化与测量的变量的相应变化应该是有意义的。这里有两个重要问题。首先,受访者某一人生阶段测量的变量能否等同于其后人生阶段相近概念的另一个变量(如,在原始家庭中的压力与在延生家庭中的压力)?其次,过渡是突然进行的还是逐渐进行的?受访者是否在同一时期经历了两个重要事件(如,在同一时期既工作又上学),还是该变化是突然的,受访者完全离开一个然后再进行另一个?通过测量同一时期两种情况下的变量,就有可能直接估算两个变量间的关系,并观察它们与其它变量是否有类似的关系模式。如果变量是高度相关的,或者它们与其它变量有相同的关系模式,那么就可能为同期效度建立有力的论据(Williamson等,1982;Zeller和Carmines,1980)。改变测量方法的其它原因包括,研究本身或与社会科学相关的领域出现了新的假说,同时还包括研究人员转变了他们的研究兴趣(Wall和Williams,1970)。与该研究开始时不同的新假设也可能是改变测量方法的一个原因。与这些变化有关的风险是显而易见的。如果其它研究已经清楚地怀疑并驳斥该项研究依赖的假说,那么继续该研究几乎是毫无意义的。然而,彻底推翻某一理论或假说在社会科学领域是极其罕见的,但即使是到了那个地步,该项研究的数据对于复制旧假说的驳论还是有些用处的。另外,通过一个正在进行中的纵向研究项目转变假说、变量和测量方法将意味着转变前后的该项研究的两个组成部分可能不会有可比性。这种可能性破坏了转变前后那类纵向分析的数据的预期效用。此外,某项研究也可能会受到过渡性理论风潮的影响。追踪损耗在一个针对青少年吸毒的纵向研究中,Newcomb和Bentler(1988)在8年间遭受了55%的样本损耗率。Murray和Erickson(1987)在一项针对吸食大麻的研究中有50%的损耗率。其它的研究表现相对较佳。全国青年调查(Elliott等,1989)在8年间的损耗率为13%。Clarridge等(1977)对威斯康星州的高中生进行第一次调查后,在对其17年后的后续调查中成功的保持了11%的损耗率。其它诸如收入动态追踪研132 华中科技大学硕士学位论文究和收入及程序参与调查的预期纵向研究都有75-80%的留存率(那些在数据收集第一时期就回应的受访者)(KaHon等,1989)。对于在随后的数据收集波段失去的受访者,测量的变化可能会有些混乱,因为失去的受访者与留存的受访者在一些系统方面可能会有所不同(他们在一开始可能就会有不同的变量平均值,或者他们的变化方式与样本中的其它受访者是不一样的)。如果损耗与研究人员关注的变量的极值(如非法药物使用最频繁的人,或是违法行为研究中最严重的罪犯)不成比例,那将会产生严重的问题。因此,产生问题的不仅仅是损耗的幅度,还包括有关关键变量的损耗模式。如果研究人员不能与受访者保持联系,那么损耗率将会毫无疑问地保持高水平。Burgess(1989)和Clarridge等(1977)具体陈述了追踪受访者的技术。这些技术包括:在第一次和随后的采访中,应获取受访者父母、亲属、朋友或其它可能与受访者有联系的人的姓名和住址,并且保证每年的邮件往来(如生日卡片,或是其它的节日问候卡片),在受访者已搬家的情况下,要求邮局提供新的邮寄地址。为了维持低的损耗率,应调用大量的资源来追踪受访者。Clarridge等(1977)在对一万多位威斯康星州17岁的高中生的后续调查中,能够找到77.4%的初始受访者,并保有88.6%的原始样本受访者。Clarridge等人运用了多种方法来维持他们的高受访率,包括受访者父母、大学及中学、邮局、军事局、邻居和朋友。Burgess(1989)总结道,即使调查跨越时间很长,能够接触或追踪80-90%的受访者都是合理的。如果某个追踪数据有50%或以上的损耗率,那么人们可以合理怀疑其分析结果是否适用于保有的受访者以外的个体。从某种程度上说,追踪损耗对于变量分布和数据的实质结论的影响是肯定存在的。二元测试(Bulmer,1979)可用于衡量随着时间的推移,不同人口统计类别(男性还是女性,白种人还是非白种人,等等)的个体比例是否会发生变化。其它的统计显著性测试还可用于衡量在数据收集第一波段出现并持续到随后波段的受访者与那些在随后波段就消失了的受访者在以下方面的不同:(1)特定的变量值;(2)变量间的关系强度(如相关性);或(3)三个或三个以上变量集的关系强度(如多元回归方程或协方差结构)。这种测试可以发现数据收集不同波段的样本变异。尽管如133 华中科技大学硕士学位论文此,一些会显著影响实质分析结果的样本变异因素可能还是无法检测到。例如,不同的行为轨迹(如,吸毒量的增加及减少),有些会继续留在样本内,有些会被踢出样本,而使用上述方法并不能很容易地检测到该现象。这会使诸如行为发展趋势的估计和对这样的实质性结果的阐释产生偏差,并且也极其难以察觉。在回溯追踪设计中,追踪样本损耗问题的形式有所不同,采用统计显著性测试估计对此毫无作用。回溯研究面临的是数据选择的问题,而不是与受访者经过第一轮数据收集后离开追踪样本的问题。尤其是在长期研究中,回溯研究可能会丢失一些样本个体,例如,个体死亡或搬离样本取样区域,或者是在数据收集期间行使上述行为。这些个体与样本中的其他个体可能有系统上的差异。例如,频繁使用非法药物的人会比其余的人死亡率高。如若这样,该研究期间的频繁使用非法药物的人会欠采样,而这会使非法使用药物率变化的预估产生偏差。实际上,这是一个追踪样本损耗问题,但该损耗是在样本采集前发生的。相比预期追踪设计有关的损耗,检测和衡量该类损耗要困难得多。重复测量和追踪对象调节在对受访者集体进行继续研究的过程中,追踪对象调节的影响(如Kalton等,1989)主要是微观社会学和纵向追踪设计的问题,包括涉及预测的实验性和准实验性设计。重复测试可能会损害实验性和准实验性设计的内部有效性,但研究人员可运用控制组来衡量该影响,如若存在,还可判定除了重复测量导致的变化外,是否还具有其它的处理效应。调查研究方面的一个例子就是,重复采访效应损害了全国犯罪调查的有效性(Cantor,1989)。Mensch和Kandel(1988)在俄亥俄州立大学人力资源研究中心进行的一项吸毒研究中也发现了类似的问题。受访者回答问题的意愿某种程度上会唤起其对一个已回答问题的记忆(如后续问题),而这只是影响相同实例持续研究有效性的威胁之一。持续研究也可能会使更多受访者不愿参与到研究中来,从而导致样本损耗。然而,还有一种可能性是,受访者参与调查后,情况会有所改变。全国青年调查1984年期间引入了抑郁量表,根据临床抑郁量表记录,感到沮丧和有抑郁症状的受访者有权要求匿名转介到精神健康专业人员或机构去。这一简单的选择权可能会改变受访者的观点或行为(这占总134 华中科技大学硕士学位论文样本的一小部分)。Collins等(1989)报道称,在一项对老人亲属的家庭看护进行的研究中,此项改变对52%的受访者至少有一项影响,最常见的是他们(看护者)怎样处理为老年亲属提供家庭看护的压力。Rubin和Mitchell(1978)报道称,在一项有关关系发展的纵向研究中,夫妇关系也会受到该研究的影响。一个共同的现象是,受访者对于他们的观点、情感和行为会有所察觉并自我反省。而这是否会反过来改变受访者的观点、情感和行为,目前仍难以下定论。同时,对于这些影响是否会出现在单个的横向研究中,还是只出现在涉及研究人员和受访者反复接触的纵向研究中,我们也尚不明确。并非只有持续的调查研究才存在这个问题。包括观察性研究在内的任何预期微观社会研究,只要存在研究人员与研究对象的接触联系,或者研究对象察觉到他们是被监测的,那么这样的风险都会存在。至于宏观研究,因为它依赖于数据收集或积累的方式,所以此类问题比较少。美国在收集职务犯罪、人口普查和重要统计数据的时候,其时间跨度不会对数据随时间推移的有效性造成负面影响。就算有,也是正面影响。在美国人口普查期间,包括过去几年在内的普查覆盖面日益完善(Robey,1989),联邦调查局的犯罪统计报告的警区覆盖范围也日益完善。同样,有关人口、经济发展以及其它有民族特性的国际统计也没有随着时间的推移而情况恶化。同时,值得注意的还有,回溯研究可能不易受到持续研究问题的影响(尽管与预期研究和横向研究类似,如果对受访者来说采访过程过于漫长而沉闷,回溯研究也可能会出现问题)。因此,追踪持续研究对象的问题主要发生在微观社会研究和前瞻性研究中。不过,还是可以通过下列方法来解决这种问题:调整数据收集波段的间隔(全国青年调查中采用的时间间隔为1到3年,而不是6个月的时间间隔)、改变不同波段的问卷设计(尽管这可能会导致不同波段收集数据的可比性存在问题)、或者是成功地鼓励研究对象和研究人员高度投入该项研究。受访者回忆Sorenson等(1980)认为,回溯研究提供了过去不良行为的准确记录。然而,为了描述该推论,他们依赖于一个基于两类不同群体(1965年加州康特拉科斯塔县和135 华中科技大学硕士学位论文1981年及1982年的密苏里州圣路易斯城区)的横向调查比较。因为1965年圣路易斯的横向数据(分别于1981年和1982年回溯性收集的)显示的不良行为发生率与1965年的康特拉科斯塔县的数据(前瞻性收集的)类似,基于该事实,他们总结道,圣路易斯的回溯性数据是合理有效的。该类说法的缺陷在于,两者间的相似性有可能是两个领域的一种偶然性趋势组合,它们只是在一个特定时期产生相同的比率。特别需要指出的是,如果在1965年康特拉科斯塔县的不良行为发生率比圣路易斯的低,且圣路易斯的回溯数据少报了其过去的不良行为,那么,尽管回溯数据的有效性存在问题,两者的不良行为发生率还是可能相同的。更好的做法是比较相同受访者的前瞻性和回溯性数据。Menard和Elliott(1990a)采用全国青年调查的数据来对比以下两种情况:(1)基于一年、两年和三年回忆期间的犯罪盛行率趋势(样本中的犯特定罪行的受访者比例);以及(2)基于一年回忆期间的前瞻性数据和变量回忆时期(通常为10年)回溯性数据,严重犯罪的盛行率。图4.1说明了一般性非毒品犯罪、严重(禁止性)非毒品犯罪、吸食大麻、及其它非法药物(吸食多种毒品)使用一年、两年和三年回忆期的比较。实线代表1976-1983年一年期前瞻性回忆数据发展趋势(1981年和1982年的年度数据缺失;实线仅连接了1980年和1983年的数据点)。虚线代表1981年三年回忆期的和1982年两年回忆期的发展趋势(并把1980年和1983年的数据点连接了起来)。在1981-1983年间,前瞻性数据(基于1980年和1983年的)表明了一般犯罪、禁止性犯罪和吸食大麻的稳定或下降趋势,但扩展回忆数据(1981年和1982年)则指示的是上升趋势。在吸食多种毒品方面,扩展回忆数据与一年期回忆数据相差不大,但所有四种类型的违法行为加起来,则有一个“长勺型”效果,长期回忆数据的发展趋势线远远低于一年期回忆数据的发展趋势线。如若受访者被要求回忆事件或行为的时间间隔拉大,那么他们会忘得越快,图4.1正体现了该种发展模式。对于一些违法行为(吸食致瘾毒品)来说,记忆衰减的问题并非那么严重,而其它类违法行为(一般的非吸毒犯罪行为)却表现得恰恰相反。Menard和Elliot考虑过该模式的其它可能的解释,但还是得出以下结论:受访者被要求回忆事件的间隔期间越长,其记忆衰减性越强,这是该模式的最合理解释。136 华中科技大学硕士学位论文在对比前瞻性(一年期回忆)和回溯性(十年期回忆)数据时,受访者被问到他们是否(若有,是何时)曾经有过严重犯罪行为(强奸、抢劫、严重袭击、群殴、入室盗窃、偷盗50美元以上、机动车盗窃、以及贩卖致瘾毒品)。简言之,前瞻性自我陈述包括了90%以上的回溯性自我陈述的犯罪行为,而回溯性自我陈述只涵盖了不到一半的前瞻性自我陈述发现的犯罪行为。这些结果与间隔越增加、记忆越衰退的假设是一致的。Menard和Elliott检测了对于这些模式的另外一些可能的解释,但仍发现没有比这更适合的解释了,那就是,对于发生的几年前的事情总是难以回忆起来。虽然总体来说,这些结果并不能把使用回溯数据排除在外,但目前可以确定的是,对于一些行为来说,长期的回溯数据并不可靠,并可能会产生与前瞻性数据显示的相反的趋势或效果。回溯性和前瞻性追踪数据不应被交替使用,除非有证据表明回溯数据要求的扩展回忆时期并不导致受访者回忆不全早年发生的事件。反复实验和回忆方面的问题可能还包括叠缩和反叠缩现象:把某一时期发生的事件陈述为在其之后或之前一段时期发生。在全国青年调查中已发现有叠缩现象(Lehnen和Skogan,1981),而其第一位受访者的采访记录并未用于样本受害率的估计。其它研究试图采用记忆边界技术(如参考诸如生日或节日这样的特殊事件)来减少叠缩和反叠缩的影响。全国青年调查的数据(Menard和Elliott,1990a)还表明,当回溯数据和预期数据具有可比性的时候,会出现叠缩现象和反叠缩现象。受访者回忆的问题主要出现在微观社会采访研究中。使用预期追踪设计有助于减少这些问题,但并不能完全消除它们。由于受访者被要求陈述事件或行为的时间间隔拉大,回忆失败、记忆重构(Weis,1986)以及漏报的可能性也会增加,所以回溯设计可能会存在严重的问题。出于某些目的,比如测量受访者观点随时间的变化,似乎只有预期追踪设计才能胜任。最后,当采用重复横向设计来测量随时间产生的变化时,应谨慎行事。正如Martin(1983)的例子中说明的一样,即使是抽样程序或是调查手段的使用上的相对微小的差异,都可能会对反复实验造成严重的问题。纵向研究成本Wall和Williams(1970)认为,预期追踪研究每一轮数据收集的成本可能并不137 华中科技大学硕士学位论文会比类似数量的横向研究成本高。如果两者的受访人数和样本规模类似,六轮的预期纵向调查的成本可能并不会比六项横向研究的成本高。虽然如此,但一个六轮的预期纵向研究的价值与六项单个的横向研究的价值是否等同、还是相当于一个回溯追踪研究的六倍的价值,这些是需要考虑的问题。并不是所有的研究类型都需要纵向研究数据,而有些确实需要依赖于纵向数据的研究可以用其他研究人员收集的纵向数据进行二次分析。对于某些研究目的来说,纵向研究是唯一的选择。如果研究目的是衡量历史变化或发展变化,那么纵向设计是必不可少的,尤其是对独立的年龄、时期和组群效应来说。若要测量一个时间跨度很长的变化,那么对于该项研究来说,预期追踪设计或是总人口设计将会是最适合的选择,因为独立样本(在重复横向设计中)会各有不同,除非每个波段的数据采样和数据收集的正式和非正式的程序都是完全一致的(Marlin,1983)。此外,回忆失败可能会导致回溯追踪设计的推论不能成立。如果是衡量在一个相对短的时期内(几周或几个月)的变化,那么回溯设计可能适用于事件或行为方面的数据收集,但对观点或信念方面可能并不适用。如果因为预期追踪过程中的重复访谈或观察导致追踪样本调节出现问题,那么就适用采用重复横向设计或循环追踪设计。如果某项研究的目的是确定或估计因果关系的强度,那么纵向研究可能会再次比横向研究更适用,尤其是在真实的变量变化的因果次序和时间次序不确定的情况下。从理论上得出的假设,或是更糟的情况--通过正确的因果次序和时间次序来猜测出来的假设,它并不足以代替真正的因果次序和时间次序,而且时间次序是必须通过测试以检验拟议的因果关系是否存在的。最好的因果关系测试需使用实验性设计(Babbie,1989;Bailey,1987;Campbell和Stanley,1963;Williamson等,1982),而且实验性设计通常也会明确要求,至少是暗含预期纵向设计。如果关于变化的测量不是问题,而且因果次序和时间次序是已知的,或者研究并不关注因果关系,那么横向数据和分析可能就足够了。但是,如果研究问题需要用到纵向数据和分析,那么投入更多的资金来取得正确的答案,比花较少的钱来获得一个很可能是错误的定论要有意义得多。在这种情况下,纵向研究是否值得其花138 华中科技大学硕士学位论文费的成本与采用纵向方法还是采用横向方法无关;它涉及的问题应是,考虑立项的某项研究问题的重要程度是否值得纵向研究的成本。所以应在正确做研究和完全不做研究两者之间做出选择。5.纵向分析在第二章中,我们讨论了纵向研究的两个主要目的:描述变化,以及分析因果关系。本书最后一章将更广泛地论述实现这些目的的分析方法。这样一来,本章我们把重心从纵向数据收集转移到了纵向数据分析上来,说明的是数据收集好之后该怎么做的问题。纵向数据分析的多种方法在其它文献中已详细讲述,本章将不会详细说明该如何使用各种方法,而是着重介绍纵向研究可能需要解决哪些不同类型的研究问题,以及用于回答这些问题的不同方法。在有关各种方法的参考资料中,读者可以找到纵向分析方法的详尽说明。定义及测量变化纵向研究的最基本任务可能也是其最难以解决的任务。首先,需要对质变和量变作出区分。质变的测量很简单:变量的值(如在质态上)要么有变化,要么没变化。例如,一个人要么是从非不良状态(无不良行为)转移到不良状态(有一些不良行为),或者是保持其非不良状态。一个人从蓝领工人转向了白领工人,或是继续还是蓝领工人。对于各个变量的各自类别,其模式是相同的:要么有变化,要么没变化。因此,纯质变的测量就是一个简单的“是--否”二元选择问题。如果研究类别是有序的而且数量有限,那么用该种二元法来测量变化就足够了,但对于有多种类别的顺序测量来说,一个更详细的定量变化测量方法可能会合适或是理想一些。我们可能会更想知道某个实例是怎样变化的(如,对于“宗教”这样的名目分类,我们可能会想知道某人是否从新教转而皈依了罗马天主教或是犹太教),但原则上,这也就意味着基于不同的二元变化的可能性构建不同的类别(在时间点1有一个状态,在时间点2又有一个相应的状态)。是否存在变化,这还是一个二元选择问题。关于连续的变化测量尺度,通常来说有两种。一种是根据减法定义的某变量后期得分和前期得分之差:X2-X1,下标数字指代时间周期。这可称为差异、变化得分、原始变化、或是原始增益。第二种用于变化研究的方式是残差增益。为了计算139 华中科技大学硕士学位论文残差增益,变量Y2首先对Y1进行回归(使用线性回归法),以获得Y2的一个预期值。Y2的预期值,也就是E(Y2),是取决于Y1的值,以及两个参数的值a(截距;即当Y1为零时Y2的值)和b(描述Y2和Y1关系的最佳拟合线斜率):E(Y2)=a+bY1。残差增益得分是Y2的实际值和Y2的预期值间的差额:残差增益(Y)=Y2-E(Y2)=Y2-a–bY1关于比例尺度的变化,第三种常用的方法就是Z的变化百分比:变化百分比(Z)=100%(Z2–Z1)/Z1。需要注意的是,该方法并不适用于除比例尺度以外的其它量表,因为对于没有非任意临界点的比例,在变化百分比测量上还有其它的各式无数的有效方法。为了说明这一点,我们以温度举例。在此区间尺度,从室温到水的沸点的变化百分比以华氏温标衡量是100%(212-70)170=203%,以摄氏温标则为100%(100-21)/21=376%。衡量该变化的变量包括年均增长(或变化)百分比,以及基于比率而不是百分比的测量方法(如每1000或每10万的比率)。还有一种比例尺度的测量方法是复合增长率,其最为人们所熟悉的例子是储蓄账户的复利利息。任何一种变化衡量方法都可能在多于一个时间单位使用。计算方法很简单,就是将变化除以时期数量(或其它的时间单位,并非一定得与测量时期的长度一致),在这些时期内,变化的发生是为了获得原始增益、残差增益或各个时间单位内的变化百分比。更具体地说,量变衡量方法的选择很大程度上是个人偏好问题,除非残差增益得分需被用于确定其变化与预期的不一致的情况,而其变量的初始层次或数值是已知的。衡量变化以分析变化。相比描述性目的,衡量变化以对其进行分析、预测或解释(如,在一个因果模式中)显得更为困难。社会行为科学相关著作对以下问题还存在争议,即,当目标是分析变化时,选用原始增益得分来作为衡量变化的方法是否合适。Cronbach和Furby(1970)反对采用原始增益得分,因其与测量的随机误差有系统相关性,通常没有计算得出的变量得分可靠(如XI及X2),并且原始增益得分的不可靠性可能会导致荒谬的结论或虚假的推论。他们还反对用残差增益得分作为衡量变化的变量(出于相同的理由),并认为残差增益得分应仅用于(是获得该用途的分数的一个更为适合的选择)基于其初始得分以确定变化与预期不一致的情140 华中科技大学硕士学位论文况。Plewis(1985)赞成并注意到测量误差对于残差增益得分和初始增益得分都是个严重的问题。涵盖滞后内衍变量的模型可以取代那些使用初始增益得分或残差增益得分的模型,并得到了以上作者以及其它作者的一致推荐(Kessler和Greenberg,1981)。Liker等(1985)提出了一个强有力的异议。他们认为,使用初始增益得分的一阶差分方程可能会胜过横向方程式以及使用滞后内衍变量的下列线性模型:(1)不同时期的回归参数保持不变;(2)有不可测变量影响因变量,但不随时间改变;(3)这些变量的测量中存在自相关误差,它们不仅影响因变量,也随时间改变;以及(4)与给定时期的预测变量层次或数值相比,追踪数据能提供更可靠的预测变量变化测量数据。一阶差分方程的表达式为:时间t+1上的横向方程式减去时间t上的横向方程式。因而,该方程式的所有变量都可用偏差表示。需要注意的是,一阶差分方程优于其它分析方法的情况是非常有限的。尤其是变量变化的测量比其层次的测量更为精确的情况,这几乎是回避了Cronbach和Furby(1970)的下列观点:通常情况下,变量变化的测量不会比其层次的测量更为可靠。Baltes和Nesselroade(1979)认为,“有关变化测量的问题经常被援引,原因似乎在于变化界定以及测量程序使用的不确定性,而这些测量程序的性能使得人们对于派生的测量方法的有效性没有足够的信心,如差异分数。”Plewis(1985)论述了他对于差异分数的保留意见,他认为它们可能更适合用于一些经济数据,而且也可能比其它社会科学的数据要测量得更准确些。同时,Baltes和Nesselroade还注意到,完全不使用差异得分几乎是行不通的,特别是在应用研究中,需要运用预测和后续测试设计来估计数据处理或干预的效果。从上述分析中可以得出以下结论,使用何种变化测量方法来进行变化分析并不是一个简单的问题,它取决于以下因素:使用某种变化测量的理论依据(Cronbach和Furby认为这样的依据几乎是不存在的);与变化测量派生的变量测量的有效性相比,该变化测量的可靠性如何;以及模型中的变量间关系的推定要求(Liker等,1985)。变化测量还存在其它问题。上述的变化测量措施都可用于总人口设计、追踪设计、及(一些跨有限时间段的)循环追踪设计的个体或群体中(如,男性和女性;141 华中科技大学硕士学位论文较发达的国家和欠发达的国家)。在重复横向设计中,个体实例的变化测量是极少的,但在群体层面各组实例有可比性的条件下,可对某些定义明确的群体的实例的变化进行测量。对于各组实例数量充足的人口概率抽样,只要采样和数据收集管理保持严格一致就没有大问题,但原始采样或管理程序的任何偏差都可能严重危害数据的可比性,而且有可能导致在纵向分析中重复横向数据不可用(Martin,1983)。图3.2描述的所有纵向设计都可用于测量总样本或人口的变化,但对于重复横向设计仍需保持谨慎,需要确保不同时期的采样和管理程序是一致的。当试图测量变化时,我们需要考虑以下两个问题:从一个时期到另一个时期的明显差异是否真正表明变化确实发生了;它们是否表明了测量的不可靠性。之前的例子就说明了这个问题。Redfield(1930)及Lewis(1951)在墨西哥的特波茨兰得出的结论,究竟是其结果的不可靠性(两位研究人员中的一位或是两者都有偏差,并对该村庄生活作了不准确描述),还是从Redfield到Lewis的实验期间的该村庄发生了很大的变化?全国青年调查中的访谈时期数量和报告的受害事件数量的负相关反映的全国青年调查数据的不可靠性,究竟是一个真实的减少(有可能是由于“治疗”效应,因为回答调查问题会激发受访者对于其受害经历的回忆,从而使他们采取预防措施来避免受害)、还是取样问题(那些受害率最高的人们是否会间或地搬家从而脱离样本?)、或者是受害的真正时期趋势呢?据推测,到1976年,长期在某样本中的研究对象的特征已趋于稳定(即,已参与一次、两次、三次等访谈的受访者或家庭的数量预计会在头三年后保持稳定,因为样本遵循一个三年期的周期循环),而且自1976年以来,全国通信系统追踪研究中的多数犯罪的预期受害率都已下降(美国司法部,1988,1989)。因此,采用重复访谈测量的受害率下降有可能是归因于受害率的真正时期趋势的变化,但该类时期趋势并不能用以解释所有观察到的变化(Cantor,1989)。有意思的是,因为自1976年以来,全国青年调查在相同样本内有可能存在相同的系统误差分布,所以其受害率趋势有可能会比受害层次测量得更为准确;若然,这就满足了Liker等人(1985)提出的使用一阶差分模型而非滞后内衍模型来分析受害率的条件之一。回想一下,再测信度(而不是内部一致性可靠测量),这是测量本身的变化,而142 华中科技大学硕士学位论文实际上并没有变化发生(Zeller及Carmines,1980)。区分不可靠的测量和真正的变化最好通过复制及使用多个独立的可靠性测量和变化加以解决。在某些情况下,有些证据会明确地反映某个解释(如可靠性)比另一个(如变化)好。例如,违法行为发生率的变化在一个特定年龄分析中的各个年龄组有可能是类似的,而且这些变化有可能是独立于前期访谈的数量的,这说明的是真正的变化,而不是不可靠测量。如若不同年龄组的变化某种程度上与前期访谈数量相关,那么这就很可能是不可靠测量。描述变化模式描述变化模式一般有三种形式:数值、图形、或是数学模型(统计模型)。数值上的变化描述只涉及一些测量的数值变化,例如,人均国民生产总值的年变动百分比。图形方面的变化描述一般涉及绘制某图表不同时期的变量值,横轴表示时间,纵轴表示变量。图4.1就是一个图形描述的例子,并指出了在特定时期间隔内,变化趋势是向上、向下还是保持稳定,并显示趋势怎样随时间变化。定量变量的变化模式可通过确定性模型或概率模型进行数学上的描述。在确定性模型中,变化被认为是遵循一些特定的模式或规则的。如果我们能够知晓特定实例的一些预测变量变化的相关有限集合,那么我们就能够确定该实例的预测变量或因变量的值是否会变化、将怎样变化(增加还是减少)、以及变化多少。在实际社会科学领域,因为测量误差,确定性模型的预测可能会有所偏差,但原则上,我们是能够明确了解某个样本或人口的个体、群体(男性和女性,或者是较发达国家和欠发达国家)以及全体的某个变量是否也随着其它变量变化而变化,将如何变化,及其变化的程度。在概率模型中,如果我们知晓某一总人口、样本、有充足数量的群体(男性和女性,或者是较发达国家和欠发达国家)的特定预测变量的变化值,我们就能够基于一定准确度地预测会发生变化的实例的比例、会以某种方式变化的实例的比例、及其变化的平均(平均的,中值的,众数的)数量。(参见注释2,类似于物理科学与量子力学领域的情形。)这是由于概率模型的基本假设是,个体实例层次对行为会有像概率过程一样的一些影响或一组类似的影响。与其它特征相比,具有某些特定143 华中科技大学硕士学位论文特征的实例基本上更可能会往一个指定的方向变化,但群体或样本中的个体实例的变化模式并非一定得与其它的实例保持一致。观察该种模式的一种方法是,认为个体对其行为有不同的影响(某类影响对一些个体或群体作用要强些,对其它的作用要弱些),但同时,个体也有选择不同行为模式的自由,甚至可以抵制某类特定的强烈影响。有些个体会选择抵制对其行为的可衡量影响,即使这些影响很深刻,但只有小部分实例会选择抵制深刻的影响而不是不牢固的影响(这意味着深刻影响的预测误差会更小)。量变的单变量模型。社会科学领域的定量变量变化的决定性单变量模型包括:函数方程(Kim和Roush,1980:101-104)、差分方程(Huckfeldt等,1982;Kim和Roush,1980,见第五章)、以及微分方程模型(Blalock,1969:88-91;Kim和Roush,1980,见第六章)。所有这些模型描述的变量值里面,变化都被表述为时间函数。某一变量的变化描述应只包含该变量及数学公式里的时间;而对变化的解释则涉及在方程中引入其它变量。确定性变化模型的一个例子就是内部影响扩散模型(Mahajan和Peterson,1985)。诸如内部影响扩散模型这样简单的创新扩散模型通常都把给定时间作为时间函数,用微分方程描述创新采纳者的累计数(Hamblin等,1973;Mahajan和Peterson,1985)。描述该过程的一个可能的方程为:其中,X为创新采纳者的累积数,dX/dt则是X的变化率,t是以适当单位测量的时间,n和c则是需要估计的常量参数。如果我们把方程整合一下,它可等价于:这是它的最简形式。如果n=0,方程变为X=ct;X表示时间的线性函数,而常数c可用普通的最小二乘回归技术估值。该种做法,或者说是t的多项式函数变化有助于描述该种情况下的变化,即,实例数量较大(如,超过20),而测量时期数较少。这与时间序列分析正好相反(Box和Jenkins,1970;McCleary和Hay,1980),在时间序列分析中,实例的数量通常较少(一般只有一个),而测量时期的数量通常较大(最好多于50)。时间序列分析是一种概率统计方法,用以描述社会科学领域日益盛行的定量变量的变化,特别是自Box和Jenkins(1970)的著作出版以来。时间序列分析试图依144 华中科技大学硕士学位论文据四个过程组合来描述一系列的时间次序数据。白噪声过程是一系列随机冲击或变化;这是存在于所有随机时间序列模型中的随机组成部分。在自回归(AR)过程中,某一变量的现值依赖于该变量在过去某些特定时间滞后或时间间隔的数值。而在移动平均(MA)过程中,过去的白噪声过程的数值会继续影响模型变量的现值,且持续一些有限的、特定的时间滞后或时间间隔。综合(I)过程是指模型变量的值随着时间的变化有明显的变化趋势或漂移,但系列却没有因其后特定时间的变量减值而产生变化趋势或漂移。减值或差分的目的是获取一个固定的白噪声时间序列,其中,白噪声过程的平均值为零(即,某一时间的系列随机组成部分的值与该系列在经过任意特定时间间隔后的其它时间的值是不相关的)。除白噪声过程之外,时间序列分析还可纳入这些过程的一个、两个或所有过程,以获取一个固定的时间序列,并描述某一变量是如何随着时间的变化而改变的。长期以来,时间序列分析就被用于经济分析和预测中,并且Vigderhous(1977)已将时间序列分析应用于对自杀的研究中。质变的单变量模型。定性数据的单变量变化模型把阶段状态分析、动态类型学及分类法应用于类别的有限集,以此来保证某个实例可以随着时间的推移从某个分类转移到另一个分类。单变量变化的阶段状态模型所关注的是变量在某一特定时期(阶段)从一个值(状态)变化到另一个值的可能性。对于多个类别或多价的类别变量,每对源点(时间间隔初始的状态或值)和终点(时间间隔结束时候的状态或值)状态的过渡(不同时期间特定时间间隔内的一个值到另一个值的转变)的可能性都会计算出来,包括那些源点值与终点值是相同的情况。当源点值与终点值是相同的时候,该过渡可能就意味着该时间间隔内的成员稳定性优于其它特定时间间隔。社会科学领域的单变量阶段状态变化模型是典型的概率性的模型,而不是确定性模型。阶段状态的过渡可以用简单的过渡矩阵描述,并不用臆测马尔可夫模型过渡矩阵的基本属性(Elliott等,1989:179),包括马尔可夫链(Bartholomew,1973;Markus,1979)、对数线性模型(Hout,1983)、单变量生命表模型(Namboodiri和Suchindran,1987)、及单变量生存或风险模型(Allison,1984;Blossfeld等,1989)。生命表模型和生存或风险模型一般都需要基于多时期(通常超过10个,偶尔也少至5个)的测量。其它的模型可建立在两个时期的基础上。145 华中科技大学硕士学位论文Elliott等(1989)使用过渡矩阵来模拟青少年时期从无不良行为到不良行为和吸毒的增加这样的转变。他们采用五个阶段(1976-1980)和四个状态(对于不良行为来说,有无犯罪行为的人、初犯、模式化的不严重罪犯、以及严重罪犯;对于吸毒来说,有不吸毒的人、酗酒者、吸食大麻者、以及多种毒品使用者)。不良行为的过渡矩阵是齐次的;它们从一个时期到另一个时期的变化不会超出预期的随机误差,而该随机误差的描述是基于Markus(1979)的卡方检验。青少年不良行为的矩阵近似一个固定的马尔可夫过程。例如吸毒的过渡矩阵,统计显示,其从一个时期到另一时期是有显著不同的,或者说是非齐次的,主要原因在于青春期后期比青春期前期更容易出现更高层次的过渡模式,或者说是吸毒模式。Elliott等人把这些过渡矩阵作为描述违法行为发展模式这一更大的分析研究的一部分。他们还利用过渡矩阵来检验不同类型的违法行为的发生及终止。包括那些涉及马尔可夫模型和对数线性模型在内的过渡矩阵,它们都是基于交叉表和列联表的简单行百分比,这些行百分比比较的是相同实例集合在同一时期(列变量)的变量值。在Elliott等(1989)的例子中,转入或移出各个状态都是可能的。而在一些模型中,则存在一些吸收状态,一旦进入之后,就不能离开。最常见的吸收状态就是死亡。对于至少有一个吸收状态的齐次马尔可夫过程来说,所有的实例最终都会进入某一吸收状态,并且可以计算下列两个值:(1)在某一特定时期,吸收状态的实例比例是多少,其它状态的实例比例又是多少;(2)所有的实例,或是部分实例进入吸收状态需要多长时间。生命表模型也可用于进行类似的计算。单变量风险和生存模型与生命表模型类似,但条件是假设其风险率或是生存率有特定的分布比例。比例风险模型除外,因为它的分布情况是已知的,而该模型可用于检测其真实数据与假设分布有多大的匹配度。生存模型已被用于模拟累犯(Schmidt和Witte,1988)、劳动力出勤率(B1ossfeld等,1989)、婚姻历史(Peters,1988)、及其它涉及离散状态之间转换的事件。时间和因果次序此前,我已列出了因果关系存在的基本要求:共变、时间优先序、以及无虚假关系。这里我们论述解决因果次序和时间次序问题的两种方法:阶段状态分析和测146 华中科技大学硕士学位论文量时间次序。当变量可被编码以指示某一推定的因果变量或是因变量是否发生了改变,那么就可用阶段状态分析来指出这些变化的时间次序。这些变化可用简单的二分法(是的,变化已经发生;或者是,没有,变化没有发生)来衡量。还有一个重要的变化类型是特定状态或行为类型的发生或开始。这是指某一实例首次进入特定状态,或是对应的,某一个体首次从事特定行为。其它的变化包括行为的升级(在某一等级量表中进入一个更高层次的状态)、行为的降级或减少(在某一等级量表中进入一个更低层次的状态)、以及行为的终止(永久或临时地从表明参与某一特定行为的所有状态中离开)。全国青年调查(Elliott等,1989;Huizinga等,1989;Menard和Elliott,1990a)已采用阶段状态分析来检测违法行为的发生、升级和终止;吸毒和其他违法行为的发生;以及违法行为的发生,或是被认为是可能导致违法行为的因果变量的发生(与不良朋友交往,弱化不利于违法行为的信念)。这些阶段状态模型为一些长期存在的犯罪学上的争议提供了参考证据。其中一个例子就是吸毒和其它违法行为的关系。犯罪学家已提出了三种假设:(1)吸毒导致其它类型的违法行为;(2)其它类型的违法行为导致了吸毒;(3)吸毒和犯罪是同一组原因影响的结果(如,对于传统道德的薄弱信念,与不良朋友或犯罪朋友交往)。Huizinga等(1989)为每个行为编码,以记录每个时期的每个受访者应被归入从未有过该种行为这一类,还是有过(即使目前还不明显)该种行为这一类。某实例有过该种行为,但后期又不进行该种行为,那么这一实例就归入了该行为时间上是先于后者的这一类。Huizinga等人发现,吸毒(包括酗酒)的发生通常都会伴有其它类型违法行为的发生(这就反对了该种假设,即,至少在最初阶段,吸毒会导致其它犯罪行为),但同时也发现,严重的吸毒行为似乎会抑制严重违法行为的终止。因此,吸毒似乎并不是违法行为发生的一个原因,但有可能是违法行为延续的原因之一。用阶段状态分析来检测时间和因果次序并不总是可行的。在某些情况下,调查过程或关系已持续了一段很长的时间,所以收集其刚发生时候的数据就几乎是不可能的了。这就是左侧删失的问题,即,因其发生在数据收集的初始时期之前,故而147 华中科技大学硕士学位论文未能检测到,。此外,用来分析的变量可能具有无意义的开始或结束。例如,在跨国研究模型中,在该国家成立后的任一时期,它的经济产量、死亡率和出生率都不可能是零。这些是每个国家都有的持久特征,因为不能得知是哪个发生在前、哪个发生在后,所以我们不能建立它的因果或是时间次序。这两个变量的变化都是发生在一个时期到另一个时期之间的,而阶段状态模型并不能解决何为原因何为结果的问题。如前所述(见图3.1),简单地测量前期的某一变量以及后期的另一变量,并不能保证前者就是后者的原因。线性追踪分析(Kessler和Greenberg,1981;Markus,1979)有助于理清研究中的因果次序问题,这些研究中的变量的发生是无序的,采用阶段状态分析方法并无作用。例如,Menard(1990)采用一个两波追踪模型来检测出生率、死亡率以及社会经济发展其它指标之间的关系。与人口转变理论一致,Menard发现,死亡率对于出生率有实质性的积极影响。他还发现,死亡率对经济的繁荣(以国家级的人均国民生产总值衡量)也有积极影响,但该影响作用很小,这与马尔萨斯和传统经济学理论的观点是一致的。而与马克思与马尔萨斯的理论不一致的是,他发现出生率对经济繁荣或是死亡率似乎没有任何影响,无论是直接影响还是间接影响。运用线性追踪分析、并结合滞后内衍变量,有助于在面对因果次序的理论分歧时,区分何种变量对何种变量有影响。需要注意的是,如果要采用线性追踪模型来理清因果次序的问题,则需要满足两个前提条件。首先,滞后的时间(不同时期间的间隔)应足够某一变量的变化从另一变量的变化中分离。这一条件同样适用于阶段状态模型。如果两个变量的变化都发生在同一测量时期,那么有以下几种可能情况:(1)该两个变量确实是测量的同一事物;(2)两个变量没有逻辑联系,只是因为它们共同的原因导致它们在同一时间产生变化;第三种情况,也是最有可能的情况是(3)测量周期太长,而如果减少测量周期,我们就能暂时将两种变化区分开来。其次,在线性追踪模型中,测量周期间的时间滞后必须与它的原因产生结果的时间保持一致。如果变量随着时间的推移保持稳定的数值,那么这种有关原因和结果的滞后时间的条件就不是很关键,但是对于在不同时期波动很大的变量来说,如果原因和结果的时间滞后推定错误,很可能会导致横向变量因果次序的错误判断,甚至更有可能造成对两者关系强度的错148 华中科技大学硕士学位论文误推定。例如,如果特定的时间滞后太短,因为因果变量变化的完全效果尚未反映在因变量上,所以即使是一个紧密的联系也可能表现得比较不紧密。阶段状态模型或是线性追踪模型的使用还有另一个问题是关于逐点测量和区间测量的。逐点测量法是在某一单个的时间点进行的(例如,访谈开始的当天)。态度测量就是典型的逐点测量。区间测量法涉及多个时间区间(例如,访谈的前一年)的事件和发生频率的计数。许多的行为测量,尤其是频率(多少次)和时间跨度(持续多长时间)都是区间测量。(不应把区间测量和区间尺度混淆,区间尺度是具有一定测量性能的尺度,而区间测量则是测量期间的时间量。)逐点测量只需要一个很短的时间跨度(现在)而区间测量需要经历很长的时间跨度(去年一整年),该事实并不意味着逐点测量对于其整年的测量期间都是有效的。例如,很有可能受访当天的道德信念在过去10个月内都保持稳定(在此之前经历了从强到弱的变化),而上年吸食大麻现象都只发生在过去的8个月内(在此之后,受访者没有吸食大麻的现象)。虽然测量的次数可能表明吸食大麻现象的变化发生在信念变化之前,但该例子中的真正时间次序(如果其它条件都满足的话,也包括因果次序)则是,信念变化发生在吸食大麻现象的变化之前。如果阶段状态分析和线性追踪分析都可用的话,那么其结果就可能是互补性的,而且有助于揭示复杂、交互、或是互反关系,而这些没有完全的时间次序分析是不能够发现的。如果有较强的理论依据支持特定的因果关系存在,那么对该理论进行测试则是为了核实推定的时间次序的存在。当竞争理论假定的因果次序是不同且冲突的时候,时间次序的分析就可以为竞争理论提供一个强有力的验证。格兰杰因果关系验证。Granger(1969)提出了另一个验证因果关系影响的方向和强度的测试。X1和Yt两个变量都可表示为平均值为零的平稳时间序列,以及其中,et和ft是两个不相关的白噪声序列,而m的值大于零,但小于时间序列的长度。依据格兰杰因果关系准则,如果bj不为零的话,则是Y导致X(其隐含意义为,bj在统计上必须完全异于零)。相应地,如果cj不等于零的话,则是X导致Y的发149 华中科技大学硕士学位论文生。实际上,格兰杰因果关系验证最后就归为这一问题:“是否有某一变量的变化不能通过其自身过去的数值来解释,但能够用其它变量的过去的数值来解释?”如果答案是肯定的,那么该第二个变量则是第一个变量的“格兰杰原因”。需要注意的是,如果m=1,而且序列内只包括两个时期,那么格兰杰因果测试则弱化为一个当方程式中包含滞后内衍变量(测量时间都为时间1)时,其外生变量(测量时间都为时间1)相对内衍变量(测量时间都为时间2)的统计显著型的测试。换句话说,Y2模拟了Y1和X1的功能(在时间1上,可能有多个X变量被测量)。而该模型不包含瞬时效应(如从X2到Y2的瞬时效应)。这相当于一个没有瞬时效应的两波段追踪模型,就如Menard(1990)用来分析生育率、死亡率、计划生育和发展状况的模型一样。在时间序列长度的限制内,m的选择是任意的。BarnardandKrautmann(1988)采用的是单个的滞后内衍变量(Yt-1)和分三个时期测量的X(Xt-1,Xt-2,andXt-3)。Sims(1972)长度为8的时间滞后,以及“未来滞后时间”(本质上允许Y的未来值影响Y的现值)。作为Sims的模型中Y的一个原因,X应能够用于解释其过去值和未来的值都不能解释的Y的变化。Wright(1989)分别对滞后时间为1,2,3,4,5的内衍变量进行了分析。结果表明,不同的滞后时间,其分析结果是有所不同的。例如,滞后时间为3和4时,格兰杰因果关系可以得到证实,而在滞后时间为1,2或5时则不能。我们该如何解释这些结果呢?一般情况下,方程内的内衍变量越早的数值与格兰杰因果关系假设产生冲突的可能性更大,而当它纳入内衍变量的附加值超过一定数量时,可能就没有显著的影响。该具体数量可通过把内衍变量模拟为自回归时间序列进行估计,或者通过计算单独的普通最小二乘回归模型、或是检验纳入各个附加的滞后内衍变量(如,Yi-4的纳入)后产生的可释方差(R2)的变化来估计。如果可释方差没有显著性(参见Agresti和Finlay提出的测试,1986:372-375),那么把把该项变量纳入方程似乎就没有意义了。很有可能滞后1就足以解释因变量的变化,同时又否定格兰杰因果关系假定。如果这样的话,就没必要超出滞后1再进行分析了。很有可能Xt和Yt并不是稳定的时间序列。如果没有充分的ARIMA时间序列分150 华中科技大学硕士学位论文析方法,那么很可能就不能确定应用格兰杰测试的条件是否已满足。此外,也存在一些滥用该测试的可能性,而且人们也不能假定平稳时间序列一定是理所当然的。相反,人们应时刻注意,尤其是在常规的ARIMA时间序列方法不可行转而运用该测试方法的时候,更需保持谨慎。横向数据和因果次序。人们已想出一些办法来试图解决只有横向数据可用的情况下的因果次序问题。Simon(1954)、Lazarsfeld(1955)以及Blalock(1962)采用偏相关技术来测试有关因果次序的假设。原则上,这些方法是可用于横向数据中关于多元回归系数的假设中的(VandeGeer,1971)。它们依赖于特定变量间的特定因果关系基于理论基础的预先消除。它们不能够用于解决有关时间次序的问题,而且它们也可能会混淆轻微复杂的关系。例如,给定X和Y两个变量,两者都是相互影响的,而横向偏相关方法并不能验证是Y导致的X,还是X导致的Y,还是两者都有可能(两者相互影响)。相比之下,只要给定适当的纵向数据,阶段状态分析、线性追踪分析、以及格兰杰因果关系分析就都可得出X和Y之间的真正因果次序。二阶最小二乘法(2SLS)(Berry,1984;Heise,1975;Kessler和Greenberg,1981;Markus,1979)可结合横向数据来模拟非递归的因果关系,这些关系涉及两个或两个以上变量集合的交互影响或“反馈”。在横向2SLS模型中,如果工具变量不能单独估计,那么有关模型识别的问题就会产生。在追踪设计中,可通过使用预测变量的未来值来估计某一工具变量,以获得特定变量的现值,从而解决上述问题。虽然这看上去有悖常理,但如果其唯一目的是建立一个有关变量Xt的无偏估计,且该估计与时间t上的X的测量误差不相关,那么这种方法用在此处就是合理的。此变量随后可被用于估计Xt对其它变量的影响,但这些估值可能会有失精准(Kessler和Greenberg,1981)。除非追踪数据中存在自相关误差问题,不然2SLS估计既无必要,也不可取。然而,回归主题,在检验因果次序方面,相比横向数据,纵向数据方法更灵活、也更有普遍适用性。运用纵向研究方法来检验时间次序和因果次序最好采用总人口数据和追踪数据。它们对于群体或总体层面的重复横向数据可能会很有用,在本书有关重复横向设计变化测量的“变化测量中的其它问题”部分也有重点描述。理论上,阶段状态151 华中科技大学硕士学位论文方法可用于确定时间次序,而格兰杰测试或是线性追踪分析也可用于测试因果关系影响的强度和方向。因果分析纵向数据的因果分析包括把变化模型扩展到除时间之外或是取代时间的因变量中,有时也把时间纳入横向模型的分析技术中,要么是将时间的测量方法看作一个变量,要么就是运用两个或两个以上波段的数据来确保某一假定原因是在其假定结果之前的某个适当时间间隔测量的。有四种类型的“纯”纵向模型:(1)因变量的值被表述为自变量值的一个函数;(2)因变量的值被表述为自变量变化的一个函数;(3)因变量的变化被表述为自变量的值的一个函数;以及(4)因变量的变化被表述为自变量变化的一个函数。还有可能是混合模型,例如,因变量既包括级别变量,也包括变化率变量(如,人口密度和人口增长率都是经济发展的影响因子)。在运用横向数据的因果分析中,我们常常像测试模型D一样来表述我们的假定:X的变化会产生(导致)Y的变化。然而,通常情况下,在横向分析和纵向分析中,我们经常验证的是模型A。正确说来,模型A是指,某一变量(因变量)的级别或是数值是基于一个或多个自变量的级别或数值的。这意味着,因变量的变化也是自变量变化的一个函数,但需要验证的模型的真正表达式里只包含了变量值,而没有数值的变化。此外,很可能某一变量的变化会导致另一变量的系统性变化,但两者的数值是基本不相关的。这表明的是X和Y的初始值是独立的,但X的变化会导致Y产生变化的这样一个过程。例如,营养水平(以人均卡路里供应量衡量)在最初时与国家计划生育项目的水平(享有高的营养水平的国家,其计划生育方面的努力也多;营养水平低的国家,其在计划生育方面做出的努力也少)是不相关的,但是随着计划生育方面做出的努力的增加,人均卡路里供应量也会提高,因为个体有意或无意地更有效地调整自身的生育率,从而最终也会调整整个国家或地区的承载水平。高水平的计划生育方面的努力与高层次的营养水平仍旧没有必然联系,但计划生育水平的改善与营养水平的提高是相联系的。这里描述的过程确实是有悖常理的,但却也是存在这种可能性的。如果该种过程确实存在,那么模型D就是一个合适的分析模型,而模型A就不是。152 华中科技大学硕士学位论文另一方面,模型D对于那些采用模型A的情况也可能适用。如果某一变量的级别依赖于另一变量的级别,那么一旦第二个变量发生变化,第一个变量也必须改变(即,如果模型A正确的话,第一个变量的变化是建立在第二个变量变化的基础上的)。分析说来,正如Liker等(1985)认为的,模型D可归因于一阶差分模型的使用。在一个一阶差分模型中,所有变量都被表示为原始增益得分。纯模型B形式的一个例子就是压力水平(因变量)和收入变化量(不论收入水平如何,大幅加薪可减少压力,大幅减薪可增加压力)间的对应关系。模型C是微分方程模型的标准形式。例如,Richardson(1960)就运用一些微分方程来解释几个国家间的军备竞赛:其中,X和Y代表两个国家的军备水平,j和k代表非负“防御”系数(基于另一国家军备水平的军备需求的积极影响),a和h代表非负“疲软”指数(在其国家军备水平已知的条件下,其国民经济的流失,或者是不愿进一步建设其军备水平),g和h是常数,指代积极或消极的“不满”因素,可以通过各个国家相互之间的敌意(积极的情况)或友好程度(消极的情况)来灵活表示。该方程右边的dX/de和dY/dt是随时间推移的变化率;方程左边的表示变量X和Y的层次水平。模型C也被Mauldin和Berelson(1978)用于回归分析,以解释欠发达国家的原始出生率的变化。其中,原始出生率是因变量,而计划生育水平以及社会经济发展指标被看成是自变量。Tsui和Bogue(1978)也用类似的变量进行了类似的分析,但采用的是模型A结合滞后内衍变量。Markus(1979)解释说道,运用增益得分作为因变量与运用滞后内衍变量作为因变量是一样的,除非在使用增益得分作为因变量的模型中,其滞后内衍变量系数推定只有一个。对于因变量为Y,自变量为X的滞后内衍模型来说,重新计算为,如果c=1,则方程就是标准的回归模型形式,其因变量为增益得分(Y2-Y1)。因为增益得分方法和滞后内衍方法是相似的,所以难怪Mauldin及Berelson(1978)与Tsui及Bogue(1978)得出的结论实质上几乎是相同的;甚至其因变量的可释方差几乎都是相同的。Markus(1979)认为,在上述模型中,通过约束系数C等于一,那153 华中科技大学硕士学位论文么就不会有增益得分,所以他推荐使用滞后内衍变量作为因变量,而不是增益得分。该建议与Cronbach和Furby(1970)的推荐是一致的,但正如上文所述,Liker等(1985)对此则有不同的看法。纵向数据因果分析方法。用于横向数据分析的所有方法在相同条件下(对于这些方法的基本假设和限制也给予相同的关注度)也可用于纵向数据分析。简单的频数分析;关联、离差和集中趋势方法;以及列联表方法都可适用于纵向数据。因此,同时也包括统计显著性的参数和非参数测试。也可采用多元(或多变量;参见Kleinbaum等,1988)方法。主要的区别在于,在纵向分析中,这些方法适用于时间次序的数据,用以分析单个变量在两个或两个以上时期的变化,而不是两个或两个以上的变量在单一时期的变化。表5.1列出了一些适用于有关因变量和自变量的测量水平的不同组合的分析方法。潜在变量结构方程模型(Bollen,1989;Hayduk,1987)已成为横向数据分析和纵向数据分析的标准模型。线性追踪模型(Kessler和Greenberg,1981)、多元回归和路径分析(Heise,1975;Johnston,1984;Kleinbaum等,1988)可看成是更广泛范围内的潜在变量结构方程模型的特殊情况。当因变量和自变量都在一个连续的测量尺度内测量、且变量的测量时期数很大时,传递函数或是多元时间序列(Box和Jenkins,1970;McCleary和Hay,1980)都是适用的。此外,作为时间序列分析变体之一的频谱分析(Jenkins和Watts,1968;Wei,1990)也适用于解决涉及从一个或多个时间序列到另一个时间序列的预测的问题。有类别变量或是混合变量预测特定的连续因变量,运用连续预测的方差分析(ANCOVA)来进行类别预测的方差分析(ANOVA)就是可行的,只要数据满足方差同质性和相同单元尺寸的假定条件(Bohrnstedt和Knoke,1982;Iversen和Norpoth,1987;Wildt和Ahtola,1978)。哑变量回归是ANOVA的一个变体,也值得采用。如果有一个至少是有序的类别预测和因变量,那么就可考虑采用类似于ANOVA的非参数法;例如,Friedman双向方差分析、以及Kruskal-Wallis单向方差分析(Daniel,1978;Siegel,1956)。在回归分析和相关分析方法中,纵向分析可能会导致一些问题,而这些问题与154 华中科技大学硕士学位论文我们在横向回归分析中遇到的又有所不同。自相关误差是在横向模型和纵向模型中都可能存在的问题;在横向模型中,可使用德宾-瓦特逊(Durbin-Watson)检验方法进行检验,但对于滞后内衍变量来说,就需要对德宾-瓦特逊检验方法进行修正(Johnston,1984)。在潜在变量结构方程模型中,可能会产生分析相关误差,但除非已对该模型进行详细而正确地说明,不然数据会难以集中,或产生无意义的参数估计(如,负方差估计)。不论是纵向分析还是横向分析,共线性都是一个问题,而且可以说,在纵向分析中共线性更是一个问题。在纵向分析中,模型设定问题非常有可能会被放大,而不是减少。对于类别因变量,以下横向分析中运用的技术也可用于纵向分析中:用于持续自变量的判别分析(Klecka,1980;Kleinbaum等,1988;VandeGeer,1971)或逻辑回归模型(Aldrich和Nelson,1984);用于类别自变量或混合自变量的对数线性模型(Knoke和Burke,1980;Lindeman等,1980)。如果因变量是类别变量变量的一个衡量标准,那么用于类别预测因子的多状态生命表模型(Namboodiri和Suchindran,1987),甚至是用于持续、类别或混合自变量的事件历史分析(Allison,1984;Blossfeld等,1989;Cox和Oakes,1984;Namboodiri和Suchindran,1987),这些都可成为阶段状态变化分析的有力工具。事件历史分析是连接回归分析和在多个时期测量得出的数据过渡矩阵分析的一系列分析方法。事件历史分析通常有更多的预测因子,而且只需要更少的时间周期,而这些都是ARIMA时间序列分析难以方便且有目的性地操作的。它还可用年龄或是物理时间来作为基本的时间连续体,并用另一个时间变量作为自变量,以检验历史和发展趋势。一定意义上,多状态生命表模型可被视为事件历史分析的非参数形式。它们可分析阶段状态过渡,而不用假定这些过渡的基本时间分布(就像事件历史分析一样),从这个意义上来看,它们比事件历史分析更为灵活,但在处理大量的自变量时也会有更大的困难。所有这些分析方法都适用于总人口数据和追踪数据,而且只要小心处理,也适用于重复横向数据实例的总体类别或群体。纵向和横向数据分析。假设我们已选择好了一个理论上合适的因变量和自变量集合。且进一步假设,基于理论或是过去研究基础上的实证性支持,我们已对变量155 华中科技大学硕士学位论文两个模型哪种更合适或是更重要,这是一个理论问题,而不是实证问题,但此处的重点是,横向数据不能常规性地用于动态的纵向关系模型中。MenardandElliott(1990a)在真实的横向数据和纵向数据基础上进一步对此观点进行了说明,类似的还有Davies和Pickles(1985),他们的一个动态仿真研究表明,横向分析未能对预定义的人口参数作出正确推论,但纵向分析的推论就在允许的抽样误差范围内。纵向数据和横向数据的对比与分析本书以纯粹的横向研究与纵向研究的对比开头,以定义纵向研究。在此,本书以总结两者差异来结尾。(1)纵向研究通常成本较高。如果用横向数据就足以解决研究问题或假定,那么采用纵向研究就没有意义,或者意义不大。(2)与横向研究一样,纵向研究在采样的数据质量和准确性方面也面临同样的问题,但相比之下,可能问题会更多。有一些方法可以解决这些问题,但同样地,如果横向研究就足以完成任务,那么就没必要采用纵向研究。(3)横向研究不能理清发展(年龄)趋势、历史(时期)趋势和组群效应。当所有三种影响都有可能发生的时候,对于三种变化类型中的任意或所有项的研究都需要采用纵向数据。(4)历史变化的描述和分析绝对需要使用纵向数据;而且,相比纵向分析和横向分析中常见的分析方法,诸如差分方程模型(其中,差分是根据时间进行的)、ARIMA时间序列模型、以及事件历史分析这样的纵向分析方法可以提供更有力、更详细的历史变化分析。(5)发展趋势的描述和分析可尝试使用横向特定年龄(或特定阶段)的数据,但其结果并不一定要体现运用纵向数据得出的结论。因为发展变化是反映个体经历随着年龄的增长或是经过连续阶段后的变化,而且因为纵向数据是反映个体内的变化,而不是个体间差异的,所有建议采用纵向数据。(6)除非有支持其相对理论的其它充分的理由(如,已知动态过程是非遍历性的),应假定社会科学任一动态过程参数有效且无误地估计都需要使用纵向数据。(7)除非记忆时期很短、受访调节问题严重、或是可以证明长期记忆的问题很小157 《纵向研究》翻译项目报告作者:俞蕴琦学位授予单位:华中科技大学参考文献(2条)1.穆雷翻译硕士专业学位论文模式探讨[期刊论文]-外语教学理论与实践2011(01)2.穆雷,邹兵,杨冬敏翻译硕士专业学位论文参考模板探讨[期刊论文]-学位与研究生教育2012(04)引用本文格式:俞蕴琦《纵向研究》翻译项目报告[学位论文]硕士2013'