[독서 메모] 1-1 Time Series Analysis of Discourse - Dennis Tay
시계열 분석 (Time Series Analysis, TSA)의 다양한 활용에 관한 책이다.
시계열 분석이 담화 분석에 어떻게 활용되는지 구체적으로 살펴볼 예정이다.
1장 Time in Discourse Analysis (p.1)
언어학은 크게 텍스트 내적, 그리고 텍스트 외적, 두 가지 차원을 다룬다.
후자는 화용론이나 담화 분석과 관계된다.
담화 분석의 영역은 Anaphore, Coherence, Sppech acts, turn-taking, topics, syntactic structures, politeness, metaphor, rhetoric 등등으로 다양하다 (Van Dijk, 2011)
다양한 담화 분석 연구의 공통점은 관찰된 담화와 사회적 맥락 사이의 관계를 규명하고자 한다는 것인데, 여기에서 시간이 중요한 변수로 작용한다.
담화 관련 주요 연구 동향인 변이사회언어학(Variationist Sociolinguistics), 코퍼스 담화분석(Corpus-Assisted Discourse studies), 비판적 담화분석(Critical Discourse Analysis)을 살펴보고자 한다.
변이사회언어학에서 시간
변이사회언어학은 나이, 성별, 계층별로 담화/언어가 어떻게 달라지는지를 살펴본다.
나이, 혹은 역사적 사건을 변수로 할 때 시간은 중요한 지표가 된다.
시간을 다룰 때 사회언어학은 실제시간(real-time)과 의사시간(apparent-time) 중 하나를 택하는데,
실제 시간은 같은 연령대에 대한 과거의 데이터와 현재의 데이터를 직접 비교하는 반면,
의사시간은 여러 연령대의 현재 데이터를 비교한다.
현재 50대에 대한 데이터를 30년 전 20대에 대한 데이터에 대한 근삿값으로 생각하는 것이다.
즉, 의사시간을 활용할 때에는 "시간에 따라 언어 활용 행태가 변하지 않는다"는 것을 전제로 한다.
코퍼스 담화 분석에서의 시간
코퍼스 담화 분석은 내용보다는 방법론적인 공통점을 갖는다.
대규모 텍스트 데이터에 대해 분석을 하며, 주로 사용되는 분석 기법은 키워드, concordance 등이다.
시간은 시계열 코퍼스 담화 분석에서 중요한 역할을 한다.
즉 특정 시간 간격으로 시간대를 설정한 뒤,
서로 다른 시간대에 다른 언어적 특징을 보이는지를 살펴볼 수 있다.
주로 Log-Likelihood를 활용하게 된다.
이 때 언어적 특징에 대한 독립성이 보장되는지에 대해서는 통계학적으로 의문이 발생할 수 있다.
비판적 담화 분석에서의 시간
비판적 담화분석은 언어와 이데올로기, 힘 사이의 관계에 큰 관심을 두며,
때로는 사회언어학이나 코퍼스언어학과 방법론적으로 유사할 수도 있다.
비판적 담화 분석에는 두 가지 축이 있는데, linguistic operationalization과 level of social aggregation이다.
전자는 broad부터 detailed까지, 후자는 agency에서 structure까지에 해당한다.
사회인지적 관점은 넓게 정의된 의미와 사회에 대한 개별적 인식 사이의 관계를 살핀다.
따라서 broad와 agency 쪽에 해당한다.
반면, 담화역사적 관점은 구체적 언어 실현과 사회적 조건에의 역할을 다룬다.
따라서 detailed와 structure 쪽에 해당한다.
Reisigl(2017)에 따르면, 비판적 담화분석은 세 가지 방식으로 시간과 결합될 수 있다.
비판적 담화분석은 반복불가능성과 대표불가능성, 분석 일관성의 부재로 비판받곤 한다.
그러나 이를 극복하기 위한 여러 제안들도 존재한다. (Breeze, 2011)
시계열 분석(Time series Analysis)
아래와 같은 한계도 존재한다.
- 비판적 담화분석을 시간과 연결시켰을 때, 체계적이고 반복가능한 방식으로 그 관계를 규명하는 데에 실패할 수 있다.
- 사회언어학에 있어 시대별 언어 행태를 비교할 경우, 그 내부에서 일어나는 즉흥적 변화들을 추적하기 어렵다.
- 코퍼스 언어학 기법을 사용하면, 한정된 시대로만 분석 가능하다. 또한, 시대별 독립성을 전제로 하는데, 이는 신뢰할 수 없다.
이러한 한계에 대한 보완책으로 시계열 분석이 활용될 수 있다.
시계열 분석은 이미 여러 분야에서 활용되고 있는데,
언어학에서 흔히 사용되는 회귀 분석과 개념적으로 유사하다고 할 수 있다.
그러나 TSA는 연속적 값간의 상호의존성을 인정한다.
즉, 과거에 말해진 것은 미래의 말에 영향을 끼친다.
TSA는 선형 회귀로 설명되지 못하는 현상에 대해 모델링을 가능하게 한다.
2장에서는 TSA의 기본적인 소개와 설명을 다루고 있는데, 다양한 접근법 중 Box-Jenkins 방법에 한해서 설명할 것이다.
3장은 심리 상담 중 은유의 사용에 대한 사례연구를 담고 있으며, 4장에서는 대학 학과별로 수업에서 쓰이는 비정보적인 언어에 대해 살펴볼 것이다. 5장에서는 신문 담화에 대해 보다 큰 시간 간격으로 테러, 민주주의와 같은 주제어들의 사용을 살펴볼 것이다.
시계열 변화는 9/11와 같은 분수령이 되는 사건들과 관련해서 분석될 수 있는데,
TSA는 이러한 사건들이 더 긴 시간 맥락 속에서 어떻게 재해석될 수 있는지를 살핀다.
언어현상은 각 사례의 맥락과 관계되어 다르게 나타날 수 있다.
이 책은 이러한 차이를 어떻게 정교하게 살필 것인가를 중점적으로 보고자 한다.
따라서 분석은 "자기회귀시계열"부터 "이동평균", "난보" 등 다양한 시계열 모델에 의해 이루어질 수 있다.