2009년 7월 23일 목요일

[펌] Big Four 영영사전 비교 연구 분석 1: COBUILD

CurrentEnglish.com 사이트가 죽었더군요. 검색엔진에 남아있는 캐시를 뒤져서 퍼옵니다. 그 사이트 주인장님이 비상업적인 용도로는 퍼가도 된다고 하셨으니 저작권 문제는 없습니다.

출처:
http://www.currentenglish.com/cgi-bin/CrazyWWWBoard.cgi?mode=read&num=54&db=theory&backdepth=1

* * *


Big Four 영영사전 비교 연구 분석 1: COBUILD


1. 학습용 영어사전의 분석

1.1 왜 사전 분석이 필요하나

최근 들어서 한국인들이 영어학습에 투자하는 관심, 시간, 돈이
크게 늘어나고 있다. 분명히 이상 과열이라 부를 수 있는 최근의
한국 사회의 영어 학습 경쟁 분위기 속에서 이전에는 관심이
덜하던 이들까지도 덩달아 '영어 전쟁'에 나서게 만드는 판이다.
이런 상황이라 영어 학습의 초석을 놓는 역할을 하는 영어사전의
중요성이 갈수록 부각되고 있다. 그 중에서도 영영사전 등의
원어사전의 시장성이나 그 효과에 대한 기대가 또한 점증하고
있는 게 사실이다.

그러나 지금까지도 한국에서는 국내에서 출간된 영어사전을
비롯한 각종 사전이나 외국에서 수입된 원어사전에 대한
검증이나 분석 비판이 거의 없다시피 한 것도 사실이다. 최근에
내가 쓰기 시작한 사전 비평 분석이 거의 다라고 할 수 있다.
한국의 각 수준의 학습자들이 원어사전에 지출하는 비용이
얼마인데 이런 기초적인 검증 데이타나 글이 없다는 것은 연구
문화에서 창피한 일이기도 하다. 이러한 중요한 작업을 출판사나
수입사 등의 당사자에게만 일방적으로 맡겨 두고 있는 것은 있을
수 없는 일이다.

1.2 한국 시장의 주요 EFL/ESL 사전

그래서 CE는 일련의 영어사전 연구 분석 비평의 글에 더해
최근에 그 관심이 고조되고 있는 Oxford Advanced Learner's
Dictionary
, (OALD, 6th Edition), Longman Dictionary of
Contemporary English
(LDCE, 3rd Edition), Collins COBUILD
English Dictionary for Advanced Learners
(CCED, 3rd
Edition), Cambridge International Dictionary of English
(CIDE, 1st Edition) 등의 대표적인 영국산 영어학습용 사전 Big
Four에 대한 비평 검증 계획을 세웠다. 이제 그 비평과 분석을
공개한다.

이번 연구 분석 비평 작업에 즈음해 Big Four 중에서 새로운
판이 나온 것은 OALD(6판)와 CCED(3판)이다. 먼저 최근에 한국의
영어학습자들에게 부각되고 있는 CCED부터 다룬다.

2. Collins COBUILD English Dictionary for Advanced Learners (CCED)

2.1 CCED의 정의와 예문 수정

CCED은 전반적으로 많은 변화가 있다고 할 수 있다. 무엇보다도
코빌드 사전 시리즈를 만드는 영국 버밍햄대학교의 싱클레어
교수가 자랑하고 사수하려고 하는 real examples를 일일이
다듬고 바꿨다. 코빌드 사전의 핵심을 뒷받침하는 구어 문어
사용 정보의 집합체, 즉 코퍼스인 The Bank of English의 양이
그 사이에 4억 단어 수준으로 늘어났다. 그래서 사전 편집자들은
그 사이에 생겨난 더 좋은 예문으로 기존의 구식인 것을
교체하였고 定義도 부분적으로 수정했다.

CCED에서 사전학자의 눈으로 볼 때도 보는 사람에 따라서는 그
가치가 아깝지 않다고 생각되는 부분은 역시 definition
부분이다. 왜냐 하면 이 부분을 만드는 과정을 이해하는 사람은
그 표제어의 정의 부분이 아무렇게나 만든 것이 아니라는 것을
잘 알기 때문이다. CCED의 표제어 정의는 KWIC(Key Word in
Context)라는 방식으로 만든 최초의 사전이다. 물론 이 특징은
여전히 코빌드가 가장 내세우는 업적이기도 하다.

2.2 CCED의 정의가 의도하는 것

CCED의 정의는 표제어가 실제로 쓰이는 패턴에 맞게 만들려고
했고 예문도 수많은 자료 중에서 의미뿐만 아니라 한 표제어의
구문적인 쓰임이나 연어 관계 등에 가장 '전형적인' 예문을
코퍼스에서 선택하여 넣은 것이다. 물론 사전 편집자들이 하나
하나 보고 그 의미나 문맥, 어구 등을 검토하여 각 위치에 넣은
것이다. 이런 일은 lexicology에 속하는 것이기 때문에 어휘의
사용과 語義 분야에 전문가가 아니고서는 할 수 없다는 말이다.
이 정도로 사전을 만드는 능력을 보면 한국의 사전 편찬자들은
갈 길이 까마득하다.

CCED의 표제어를 포함하여 서술하는 형식의 정의는 장단점이
있지만 최근 Chambers Essential English Dictionary에도& nbsp;
채용되었다. 이 정의의 형식은 back chaining에서 비롯된 것으로
보인다. back chaining은 회화를 가르칠 때 학습자들에게 긴
문장의 끝을 일부에서 전체로 늘리면서 반복하는 것을 말한다.
이와 반대로 front chaining으로 반대 방향으로 할 수도 있다.

2.3 CCED는 front chaining + paraphrasing

그렇지만 코빌드의 정의 형식인 If you identify someone or
something, you name them or say who or what they are.
처럼
말하는 것은 몇 가지 장단점을 낳고 있다. 먼저 장점으로는
사전 편찬자들이 의도한 대로 정의의 예문화다. 정의 안에
identify라는 동사가 실제로 쓰이는 주어 목적어 관계 등의 구문
구조가 들어 있다는 것이다. 위에 나오는 정의는 일종의 동어
반복이라고 할 수 있다. paraphrasing과 의미적인 front
chaining이라고 할 수 있다. 내가 여기서 front chaining이라고
하는 것은 다음의 이유 때문이다. identify라는 표제어가 편집
구조상 바로 위에 나오고 그 표제어를 바로 다음에 나오는 정의
영역에서 구문 형태로 다시 반복하고 있다. 이는 identify라는
동사의 의미를 중심으로 구문의 형태(If you identify someone
or something)
를 먼저 나타낸다. 그 다음 paraphrasing의 원리로
identify를 설명하는 다른 단어를 통한 의미 반복(you name them
or say who or what they are)
을 보여 준다. 즉 코빌드의 정의는
front chaining과 paraphrasing의 기법을 밑에 깔고 있다는
것이다.

그렇다면 이 형식의 효과는 무엇인가? 문장을 통째로 외우는
것을 영어 학습의 왕도라고 믿는 학습자들에게는 아주 좋은
사전이라는 것이다. 물론 무조건 외우는 게 옳은 것인지는
의문의 여지가 많다. CCED의 편집진은 2,500개의 사전 정의용
어휘만으로 '선생님이 설명해 주는' 형식으로 풀어진 쉬운 정의
자체에는 그 단어를 문법적으로 사용할 수 있는 구조도 들어
있다는 점을 강조한다. 내가 앞에서 말했지만 '문장을 그냥 다
외우는 게 좋다'고 믿는 이들에게는 그 믿음의 한계 내에서는
도움이 될 것이라는 것이다.

2.4 CCED의 extra column의 딜레마

또 문장의 구조에 대한 지식이 부족한 학습자가 이 사전을
사용한다면 extra column의 문법 정보는 여전히 복잡하고
이해하기 어렵다. 그래서 그 왼쪽에 나란히 위치한 정의와 예문
자체가 extra column에 나오는 약호로 된 문법 정보를 해당
구문에 대입해서 비교 이해할 수 있게 도와 주는 기능을 하고
있다는 것이다.

그런데 이것은 방금 말한 대로 초보자들에게는 도움이 된다는
말이다. 그렇다면 이미 문법 구조에 대한 지식이 풍부한
학습자들에게는 어떠한가? 나는 전문가의 입장에서 무수히
경험한 학습자들의 실례를 말하고 싶다. 과연 중급 이상
학습자들이 CCED의 paraphrasing형 정의를 얼마나 기억할
것인가 하는 점이 문제이다. 만약 학습자가 참조한 단어를
모르는 경우라면 뜻 외에도 구문 정보까지 동시에 파악하고
기억까지 할 수는 없다. 거의 잊어 버리게 된다는 말이다.
한국인 학습자들의 사전 보는 습관을 잘 알고 있는 나로서는
CCED의 paraphrase 형식의 정의를 보면서 오른쪽의 extra
column의 문법 정보를 정의 문장 안의 구문 형식에 넣어서 한
번에 파악할 수 있는 학습자는 매우 드물다는 것을 말하고 싶다.
물론 실제로는 그런 정의 내의 '構文' 정보의 기억이 문제가
아니라 찾은 표제어의 의미도 기억하기 쉽지 않다는 말이다.
이는 학습자들 스스로가 잘 아는 것이다.

2.5 사전은 알아도 보는 것이다

CCED의 편집자 싱클레어는 그래서 이것을 의식하고 새로운
사전의 기능을 설명하고 있다. 한 번에 알 수 있는 사전이
아니라는 것이다. 즉, 학습자는 자신이 단어를 알고 있더라도
사전을 다시 찾아야 한다고 그는 말한다. 이게 무슨 말이냐면
EFL/ESL 학습자들은 영어에 대한 완벽한 자신감을 갖는다는 것은
거의 예외적인 경우에만 존재한다. 그렇기 때문에 단어 중에서
의미, 철자, 발음, 구문 정보 등을 안다고 다 아는 게 아니고
학습자는 자신이 가지고 있는 언어 정보가 맞는지를 확인하기
위해 사전을 찾는 일도 아주 중요하다고 말하는 것이다. 나는
그가 무슨 말을 하고 있는지 100% 이해하고 그에 동의하는
바이다. CCED은 한 마디로 만든 이들의 노력 때문에 잘
만들어진 것이지만 그것을 이용하는 이들의 노력도 아주
중요하다는 말이다. 사용하기에 결코 만만한 사전이 아니라고.

2.6 문법 약호 vs. 학습자의 심리

나중에 위의 주제로 돌아가고 이 시점에서는 이 문제를
언급해야겠다. CCED은 내 논문에서도 지적한 것이지만 다른
사전과 비교할 때 가장 눈에 띄는 형식은 문법 정보를 따로
모아서 담고 있는 extra column이다. 난 이렇게 정보를 분류하기
좋아하는 사람이라 그 분류하려는 의도 자체는 좋아한다. 먼저
이 extra column을 편찬자의 의도 만큼 잘 이용하려면 저 앞
페이지 소개편에 있는 문법 약호 설명을 자세히 읽어야 한다.
당연히 한두 번 읽는다고 다 이해하거나 기억되면 천재라고
해야겠다. 물론 여기까지는 영어를 좀 하는 사람의 이야기이다.
약호 이전에 그 단어들이 무엇인지 이해하는 것은 초보자들은
거의 불가능하다.

문제는 여기서 출발한다. 사전 이용자에 대한 조사를 살펴 보면
사전에 대한 앞 부분의 사전 설명을 읽는 이는 거의 없다는
것이다. 그렇게 부지런한 사람들이 별로 없다는 것을 사전
편찬자들은 간과한 것이다. 더 큰 문제는 그 앞부분의 문법
약호의 정보를 완전히, 아니면 적어도 80%라도 이해하지 못 하면
이 사전은 보나 마나이기 때문이다. 물론 그 약호들이 무엇을
의미하는지 모르면 extra column이 '눈에 보여도 눈에 안
보이는' 그런 사용자들이 된다.

더군다나 이 문법 약호는 한 번에 이해하거나 기억될 수 없는
성질의 것이라 자꾸 앞쪽을 참조해야 하는데. 아뿔싸 나도 그걸
반복하다 보니 이전에 한국의 학습자들이 영영사전 처음 볼 때
말하던 게 생각난다. '단어 찾다가 또 다른 단어 찾게 되잖아!'
문법 약호도 사용자가 모르면 자꾸 찾아야 하는 단어같은 존재일
뿐이다. 물론 이 문법 약호 참조의 기회를 감사하게 받아들이고
자꾸 찾으면 사전에 익숙해지고 결국 더 나은 수준의 학습자로서
그 사전이 의도하는 효과를 모두 누리겠지만 얼마나 많은 이들이
그렇게 할 수 있는지 한국인 학습자들의 사전 사용 실태를 잘
아는 전문가로서 생각할 때 좀 의아하다.

2.7 약호의 위치는 나아졌다

그런데 1995년에 나온 코빌드 2판이나 지금의 3판을 대하는
이들은 비교를 통해서 감사의 기회를 갖자. 1987년에 나온 1판을
찾아 보면, 이 문법 약호가 어디에 있냐면... 지금처럼 앞에 한
곳에 저장해 놓은 것도 아니다. 알파벳 순서로 사전 안에 넣어
버렸다. 즉 supp가 무엇의 약호인지, 어떤 역할을 맡는지
모르겠다 또는 기억이 안 난다 싶을 때마다 그것을 찾아 보아야
하는데 이게 모두 각각의 알파벳 순서에 따라 사전의 곳곳에
'분산되어' 있다는 것이다. 돌이켜 보는 것이지만 그때는 이렇게
'야만의 시절'이기도 했다. 그런데 2판, 3판에서도 이렇게
약호를 앞에 모아 놓은 게 과연 최선일까?

문제는 거기서 끝나지 않는다. 그 약호들을 '완전히' 이해했다고
해도 정의 문장과 extra column의 문법 정보 약호를 대조해 보는
일을 신중하게 그리고 세밀하게 하지 않으면 영어의 구문론적
지식의 축적은 기대하지 말아야 한다는 것이다.

물론 이런 문제는 OALD, CIDE, LDCE도 마찬가지이지만 그 차이는
크게 다르게 보인다. 뒤에서 각 사전에 들어가서 사전별로
분석하도록 하겠지만 OALD와 LDCE같은 경우는 이 문법을
설명하는 형식이 또 독특하다.

2.8 CCED는 초보자 사전이 아니다

다시 돌아와서, CCED의 초창기 편집자 싱클레어는 이
3판에서도 real example과 예문 역할도 수행하는 정의 문장
부분에서 문법 기호들이 눈을 복잡하게 하지 않도록 하기 위해
extra column에 전원 '분리 수용'했다고 말하고 있다. 나도
사전학자로서 그 의도는 아주 소중하게 받아들인다. 학습자들이
조금이라도 편하게 사전을 사용하게 하려는 좋은 의도에서
비롯된 것이기 때문이다. 그리고 그 노력도 어디 보통인가.
그런데 extra column의 문법 정보는 앞에서 말했듯이 접근
자체가 쉽지가 않다. 종류도 상당히 많을 뿐더러 약호를 먼저
이해하기 위한 노력도 만만치가 않다. 더군다나 중급 학습자
이하는 약호의 이해도 쉽지 않은데 그 약호로 이루어진 extra
column을 이해하고, 다시 정의 문장을 대조하면서 의미와 구문
정보를 동시에 수용하라고 하는 것은 상당히 높은 수준의
학습자들에게만 해당되는 말이다. 그래서 이 3판에는 for
Advanced Learners라는 표현이 붙었다. 그런 이해에서 붙인
것이라면 아주 '적절한' 시도라고 본다.

나는 싱클레어가 앞에 말한 대로 사전은 한 번 보는 것도
아니고, 이미 안다고 해도 아는 것을 확인하기 위해 찾아야
한다는 말이 바로 이러한 점을 잘 알고 있기 때문에 쓴 것이라고
본다. 사실 나같은 전문가가 보기에 CCED은 '놀라운' 사전임은
틀림 없다. 사전 만드는 과정을 너무나 잘 알기에 그 잘 아는
마음으로 말하는 것이다. 모르면 쉽게 만드는지 어렵게 만드는지
밥인지 죽인지 이해가 되겠는가? 그래서 이런 장점과 단점을 다
이야기하는 것이고 이는 뒤에 내가 한국인 영어 학습자들의 사전
이용에 대해서 한 가지 내 놓을 조언과 다시 연결되게 된다.

2.9 CCED의 '파격' 하나

CCED의 본 항목의 특징은 의미란에 품사별 구분이 없다는
것이다. 이것도 대단한 이탈이다. 아직 다른 사전들은 품사별로
의미 항목을 완전히 구분하고 있는 데다가 그 아래에 다시
의미별 소분류까지 추가하고 있는 게 현실이다. 이렇게 하는
이유는 당연히 CCED처럼 '한 표제어의 모든 관련 의미는 한 곳에
있어야 한다'는 생각으로 뭉뚱그려 놓으면 그 의도와는 달리
학습자들은 그게 동사인지 명사인지 기억이 '난장판'이 되기
때문이다. 이것은 싱클레어가 계속 고집하는 것 같은데 EFL
학습자들의 실태를 좀 더 들여다 보기 바란다. 과연 학습자들의
뇌가 그렇게 스스로 알아서 쉽게 기억을 하는지 말이다.

두 진영 중 하나는 틀린 것이다. 물론 난 CCED가 틀렸다고
본다. 싱클레어는 '의미를 한 군데로 묶는다'는 주장은 한
표제어 영역 안에서만 생각을 한 것이지만 학습자들의 '혼돈'은
사전 전체 영역에 대한 느낌에서 나오는 것이다. 사전 덮으면
이게 그것인지 저게 그것인지 생각도 안 나는 게 실제로 겪는
일이다. 무엇보다도 사전은 데이타가 많아지면 분류해야지
합치면 이해와 기억 과정에 어느 정도는 혼란을 초래한다는
사실을 이해하지 못 했다니 놀라울 뿐이다.

2.10 CCED의 늘어난 어휘

CCED의 주요 변화 또 한 가지는 어휘 수가 110,000으로 상당히
늘었다는 것이다. 1판의 어휘 수가 70,000, 2판의 어휘 수가
75,000이었으니 상당히 늘린 것이다. 이 변화는 CCED가 영어
학습사전에서 어느 정도는 reader용 사전의 기능까지 하도록
이번에 큰 변화를 꾀한 것을 말해 주는 것이다.

수록 어휘 수에 대해서 한 마디 짚고 넘어가야겠다. 최근까지도
한국에서는 사전의 '유일한 평가 기준'이 바로 수록 어휘
수였다. 지금도 이렇게 사전을 고르는 이들이 많다. 물론 뭐가
뭔지 모르는 시절에 하던 습관이 그대로 있다. 그런데 ESL/EFL
학습자에게 단어가 10만 단어 이상 들어 있는 게 과연 무조건
좋은 것인지는 뒤에서 나의 조언과 함께 다시 이야기하겠다.

2.11 CCED 본문 항목의 '섹션화'

사전의 편집 형태 면에서 볼 때 CCED에서 가장 두드러져 보이는
것은 다시 정의 문장과 real example에 대한 배려이다. 이번에
전문 편집자들이 새로 고치고 다시 쓴 이 부분이 사전의 중요한
부분인 것을 의식해서 더욱 쉽게 그리고 확연하게 보이도록, 한
가지의 정의 문장과 해당 예문이 들어간 각 단락을 섹션화해서
그 단락 앞의 경계 표시 번호를 네모 상자에 넣어서 더 잘
보이도록 만들었다. 그리고 예문도 이탤릭체로만
해 놓으면 잘 안 보이는 것을 알아차리고 그 시작 부분에
입체형으로 두드러져 보이는 작은 네모 상자를 박아서 더 쉽게
구분하도록 했다. 물론 이런 것은 사전 편집과 도안의
기술이지만 이렇게 작은 변화만 추가해도 얼마나 쉽게 정보를
찾고 접근할 수 있는지 이젠 모두들 알 것이다.

2.12 없어진 것 하나

코빌드 사전 1판에서는 쓸 데 없는 정보가 하나 있었다.
superordinate라고 부르는 단어들인데 car:vehicle의 관계에서
vehicle이 가지는 위치를 말한다. 1판에는 extra column의
동의어, 반의어 위에 이 정보가 위치해 있었는데 2판부터는
사라졌다. 물론 CCED의 3판에서야 알 필요도 없는 '역사'이지만
내가 첫 눈에 보았을 때 '이것은 무슨 할 일 없는 짓?'하고
생각했던 것이다. 사전에 들어가는 생각도 꾸준히 바뀌는데 그
새로운 생각이 들어서기 전에는 그런 전혀 필요없는 정보도
집어넣는 일을 그때는 당연하게 했다는 것을 말해 주고 싶은
것이다. 사전은 편집, 분류의 기법도 중요하지만 어떻게 하면
특정 수준의 학습자들에게 필요한 정보만을 우선적으로 접근케
할 것이냐가 중요하다는 말이다.

2.13 좋아진 것 하나

extra column에 있는 정보 중에서 코빌드 2판 사용자들이 관심도
없고 보지도 않았던 (사실은 그 란 전체도 거의 안 본다) 네모로
쌓인 pragmatics라는 게 있었다. 난 물론 편찬자들이 이것을 왜
넣고 싶어하는지 이해하지만 현실적으로 그것을 이용하는 이들이
얼마나 될까 싶다. register 정도만 제공하면 되지 pragmatics를
삽입하니 글쎄 수긍이 안 간다. 물론 '볼 수 있는 능력이 되는
사람은 봐라' 하는 생각이라면 모르겠지만.

이게 문제다 싶었는지 CCED 3판에서는 드디어 각 단어마다
해당하는 pragmatics의 세부 정보를 직접 넣어 주었다. 네모
상자에 쌓인 emphasis, disapproval같은 항목이 보일 것이다.
바로 보이도록 써 주니 얼마나 필요하고 직접적인가. 이렇게
넣으니 어떻게 그 앞 판에서는 pragmatics라고만 표기하고 세부
항목은 저 앞의 목록을 '다시' 찾아라도 아니고 'pragmatics만
보고서 알아서 추측해라' 같은 짓을 할 수가 있었는가 하는
생각이 들 것이다. 사전학을 하려면 이런 것 지나고 안다는 것은
이미 상당히 뒤떨어진 사람이다. 예측이 중요하다는 말이다.

그런데 pragmatics로 쓰다가 저 앞에 있던 emphasis 등을 단어
바로 옆에 보이게 한 것은 proximity의 문제이다. 이와
관련하여, extra column의 문법 약호가 '저 앞에' 유배지에 있는
것은 그래서 비슷한 문제를 낳는다는 말이다. 사전 찾기 또는
읽기는 '반복'이고 단순한 작업의 반복은 지겨움을 낳는다는
명제를 잠깐 잊은 것은 아닌지.

2.14 이거 여전히 실망스럽다

내가 CCED에서 실망스럽게 생각하는 것은 여전히 WSP
(Word-Specific Prepositions)에 대한 saliency 효과를 주지
않고 있다는 것이다. 내가 수백 권의 사전을 모두 살펴 보고
일본계 사전까지 분석했지만 EFL/ESL 사전 중에서는 CCED가
가장 약한 편에 속한다. extra column에 표준으로 정한 작은
크기의 폰트를 지키려는 것인지 몰라도 with 등이 너무 작게
보이니 10만이 넘는 단어와 기능적으로 상충하게 되는 것이다.
이 문제는 다른 사전의 항목으로 넘어가서 다시 언급할 것이다.

2.15 CCED의 강세 표시를 본받아라

발음기호에 대해서 한 마디 하자. 코빌드 1판을 기억하는 이들은
알지 모르지만 1판의 발음기호는 saliency가 가장 두드러졌다.
영어의 발음 기호를 학습자들이 대하는 데 있어서 가장 중요한
것은 강세의 위치이다. 영국계의 다른 사전들은 보통 강세
표시를 해당 음절 바로 앞에 표시해서 처음 보는 한국인
학습자들에게는 혼란스러울 수도 있다. 그런데 코빌드 1판에서는
지금의 CCED 3판에서도 여전히 강세 음절 아래에 밑줄을 그어서
인식을 향상시키고 있다. 난 이 효과가 아주 뛰어나다고 본다.
원래 독일어 사전의 강세 표시가 해당 음절의 위에 줄을 긋는
것인데 그것을 원용한 것으로 본다.

코빌드 1판에서는 이에 더해서 강세가 있는 모음을 bold로
나타냈었다. 이게 아주 좋았다. 강세 모음 bold 표시가 없어진
2판, CCED 3판을 비교하면 1판의 saliency 효과가 훨씬
뛰어나다. 이것을 왜 없앴는지 이해가 안 된다. 내가 보기에 이
정보는 중복이 아니다. 학습자들의 단어 강세 위치 파악과 기억
효과를 향상시키는 데 더욱 일조할 뿐이다. 다시 되돌려 놓기
바란다. 다른 사전에 비해서 코빌드가 가지는 뚜렷한 장점 중에
하나인데 스스로 포기하다니!

2.16 중요하고 또 중요한 빈도 표시

CCED가 가지는 또 하나의 장점이 있다. 단어 사용 빈도
표시이다. 한국계나 일본계 사전을 보면 표제어의 폰트 크기나
색으로 빈도를 임의로 표시한지가 이미 오래이다. 요즘 일부
사전에서는 정의 영역에서도 중요한 뜻은 볼드체의 컬러로
표시해서 saliency를 높이는 사전들이 많다. 코빌드는 The Bank
of English라는 코퍼스를 근거로 얻은 데이타로 분석해서 영어
단어의 실제 사용 빈도를 과학적으로 추려내었다.

중급 이하 영어 학습자들에게는 이런 saliency를 높이는 도구는
아주 필요한 것이고 '복음'이기도 하다. 사실 처음 영어를 배울
때 중요도에 따른 구분도 없이 10만 단어를 던져 주면 그 던진
팔을 물어뜯고 싶은 생각 외에 무엇이 떠오르겠는가. 그런데
한국계 영어 사전뿐만 아니라 영국계나 미국계 영어사전조차도
그런 빈도 표시도 없는 겁나는 시절이 불과 10년 전에만 해도
있었다는 것이다.

2.17 불과 2천 단어가 중요하다

CCED에 빈도가 표시된 어휘 중에 black diamond 다섯 개의
최고 빈도에 속하는 어휘는 680개이다. diamond 네 개의 다음
빈도는 1040개이다. 코퍼스 데이타에 따르면 이 frequency band
5와 4에 속하는 단어가 실제 사용 영어 양의 75%를 차지하는
것으로 나왔다고 한다. 내가 개발한 약형드랩 청취법의 이론도
여기에 일부 관련이 있다. 단어의 빈도 표시는 초판부터 꾸준히
붙이고 있는데 다른 영어 학습 사전 중에서 LDCE에서만 빈도에
대한 정보를 찾아 볼 수 있다.

2.18 full name에 집착하기

CCED을 다른 사전과 비교할 때 독특한 것 하나는 U/C 표시이다.
약호가 너무 많다는 생각에서인지 N-COUNT, N-UNCOUNT 형식으로
명사의 수량 특성을 나타내고 있는데 난 불만이다. 사전이라는
것은 기본적으로 복잡하고 따분하다. 사전을 즐겨 보는 이들은
거의 없기 때문에 직관적인 인터페이스는 사전의 매우 중요한
특질이어야 한다. OALD도 여러 과정을 거치면서 지금은 (C)OUNT
명사는 기본으로 해서 일부러 표시하지 않고 (U)NCOUNT만을
표시한다.

이분법은 종종 기억에는 편하고 직관적임에 틀림없다. 화장실
문의 남자/여자, 전원 스위치의 ON/OFF처럼 상대를 반드시
표시하는 관습에 젖은 것이겠지만 그런 환경은 접하는 데이타가
매우 적지만 사전은 오히려 데이타가 너무 많으니 탈인 것이다.
OALD, LDCE, CIDE를 포함해서 거의 모든 한국계나 일본계
사전들이 모두 U/C의 약호만으로 쓰고 있다. 이런 게 아주
당연한데도 약호를 일부러 길게 풀어서 써 주는 것은 의미 없는
일이다. 이런 수없이 많이 접하게 되는 상용 약호는 쓸 데 없이
길게 풀어 쓰고 extra column의 문법 약호는 되려 수없이
양산하면 결과는 피곤하다는 것이다. 이 부분은 OALD에서 다시
쓰도록 하겠다.

2.19 이렇게 줄여야 한다

작은 변화도 보인다. 이전 판에서는 In British English...
이렇게 길게 설명하면서 쓰던 것을 포기하고 [BRIT]처럼
바꾸었다. 두 말 안 해도 왜 그렇게 해야 하는지를 알 것이다.
이런 것도 정의 문장을 길게 늘어뜨리는 것에 시사하는 바가
있다.

다시 CCED의 extra column의 문법 약호로 돌아가서 할 말이
있다. 코빌드가 초판의 'V + O + O'에서 'V n n'으로 바꾼 것은
잘한 것이다. OALD도 이렇게 되어 있는데 실제의 문법적 순서 및
위치와 일치하기 때문에 인식 효과가 좋은 데다가 O라는
목적어의 개념을 빌릴 필요 없이 (즉, 약호나 용어를 하나 더
추가할 필요 없이) n으로 표시할 수 있다는 것을 인정한 것이다.

2.20 소분류의 장점 무시하기

CCED는 이번에 한 가지 더 개선을 해야만 했다. 코빌드 편집의
총 책임자였던 싱클레어는 이번에도 고집을 부렸기 때문이다.
무슨 고집이냐면 CIDE나 OALD, LDCE가 모두 채택해서 좋은
효과를 보고 있는 guide words같은 의미 소분류를 여전히 거부한
것이다. 그의 주장대로 그는 '모든 관련된 의미는 한 위치에서
찾을 수 있어야 한다'는 고집을 부렸다. 물론 이것은 크나큰
오판이다. 소분류를 만들거나 CIDE처럼 아예 소분류마다 표제어
하나의 위상을 부여하는 레이아웃도 사용자들에게는 별 문제가
없다.

학습 사전에서 표제어의 의미를 보여 주는 대원칙은 어디까지나
의미의 빈도 순이어야 한다. 언어의 사용에 있어서 더 중요하게
생각해야 할 가치 기준이 그 외에 무엇이 있겠는가. 그 고집을
조금이라도 '속죄'하려고 그는 get같은 의미 항목이 매우 많은
중요한 표제어 앞에 LDCE에서 보이는 식의 길라잡이인 menu를
넣었다. 물론 그 기능은 LDCE의 signpost의 그것과 같다. 이렇게
일부라도 보충하려면 아예 CCED에 나오는 frequency band 1, 2의
빈도가 높은 단어들 모두에 의미 소분류를 넣었으면 좋았는데 별
중요하지 않은 '의미 집중의 원칙'에 집착하다가 좋은 기회를
놓친 것 같다. CCED는 다음에 이 의미 소분류를 넣지 않을 수
없게 될 것이다.

2.21 초보자용 코빌드는 어떤 것인가

CCED는 전반적으로 볼 때 초보자가 보기에는 당연히 어려운
사전이다. 그렇다면 Collins COBUILD Learner's Dictionary 
(CCLD)나 Collins COBUILD New Student's Dictionary (CCSD) 를
사용하도록 해야 할 것인데 실상은 또 다르다. 지금 나와 있는
CCLD를 보면 CCED처럼 정의와 예문의 항목이 번호를 붙여서
일목요연하게 구분이 되어 있지 않은 이전 판이고, OALD처럼
표제어의 정의 항목이 모두 연이어서 편집되어 의미 항목 구분이
쉽지 않게 돼 있다.

더군다나 이번에 CCED에서는 고친 pragmatics 표시도 CCLD에서는
이전의 것 그대로이고, 정의 및 예문 등의 표제어 본문도 CCED의
개정 내용 이전의 것으로 보인다. 새로운 CCED에 따른 이
소형판들의 새 판이 나오면 학습자들은 그에 알맞은 수준의
사전을 골라서 써야 한다. 이 이야기를 하는 것은 CCED는 앞에서
말한 것처럼 낮은 수준의 학습자가 보기에는 녹록치 않은
사전이기 때문이다.

CCSD도 본문 항목 배열이 CCED와 비교하면 복잡하다. 다만 extra
column이 따로 없고 각 정의 앞에 품사 약호가 있다. 모든
동사가 VERB로만 표시되는 약점이 있다. 또 CCED에서 그러는
것처럼 품사별 본문 항목 구분도 역시 없다는 약점도 여전하다.
앞으로 어떻게 나올지 모르지만 CCED 방식과 CCSD의 범위를
혼합한 새 판이 나오면 CCLD나 CCSD가 CCED를 사용하기에 힘든
수준의 학습자들에게는 맞는 사전이 될 것 같다.

계속

글 찾기

글 갈래