영어 어휘력 테스트 무료 4종 비교: 내 영단어 개수, 8분이면 안다

단어가 떠오르는 펼친 사전과 어휘력 측정

영어엔 약 170,000 단어가 살아 있지만, 원어민조차 평균 4만 개 안팎만 안다. 영어 어휘력 자가측정이 처음이고 "내 영단어 개수"가 궁금한 사람을 위한 글이다. 측정 원리, 무료 영어 어휘력 테스트(vocabulary size test) 비교, 점수 올리는 법까지 정리한다.

핵심 요약: 숫자부터 정리

영어 어휘 측정에서 자주 헷갈리는 4개 숫자를 먼저 박아둔다. 단위가 다르면 비교가 무의미하므로 정의와 출처를 함께 적는다.

구분대략적 수치정의·출처
영어 전체 단어약 170,000개(현재 사용) / 표제어 500,000+"현재 쓰이는 단어" 기준은 사전사 추정, OED는 50만+ 표제어·100만+ 어휘 항목
원어민 평균(20세, 미국)약 42,000 lemmaBrysbaert et al., 2016, 표제어(lemma) 기준 평균
성인 수동(이해) 어휘약 40,000~50,000개 (상업 추정치)읽으면 아는 단어. vocabulary-test.com 추정·학술 정밀치 아님
성인 활성(능동) 어휘약 20,000~35,000개 (상업 추정치)직접 말·글로 쓰는 단어. 출처·정의 동일(Brysbaert와 단위 상이)
비원어민 학습자약 4,500~12,000개교육·노출량에 따라 큰 편차. 상업 추정 범위

원어민 20세 평균이 약 42,000 lemma라는 수치는 22만 명 이상이 참여한 대규모 연구에서 나왔다(Brysbaert et al., 2016, Frontiers in Psychology). 같은 연구에서 하위 5%는 약 27,000, 상위 5%는 약 51,700이고, 20세에서 60세까지 약 6,200 lemma(약 2.4일에 한 단어꼴)가 더 쌓인다.

수동·활성·학습자 어휘 수치는 학술 정밀치가 아니라 상업 측정 사이트의 추정 범위다. Brysbaert 연구는 능동/수동을 구분하지 않으므로 단위·정의가 달라 같은 자로 직접 비교하면 안 된다.

영어 단어는 도대체 몇 개인가: 17만 vs 50만의 함정

"영어 단어 수"는 단일 숫자가 아니라 정의에 따라 2~3배씩 흔들린다. "현재 사용되는 단어"는 사전사들이 대략 170,000개로 추정하지만, Merriam-Webster는 그중 약 45,000개 이후부터 대부분 고어·전문용어·파생형이라 일반 어휘와 거리가 멀다고 본다(Merriam-Webster, How many words are there in English?). 반면 옥스퍼드 영어사전(OED)은 50만+ 표제어와 350만 건 인용으로 1,000년치 영어를 담는다(Oxford University Press, 2026-03).

그래서 "17만 단어 중 몇 개 아느냐"는 질문 자체가 약간의 함정이다. 측정 도구가 비교 기준으로 삼는 건 17만 개 전체가 아니라, 실제로 쓰이는 빈도 상위 단어들의 분포다. 17만은 사전의 재고일 뿐 당신이 외워야 할 목표가 아니므로, 이 숫자에 압도될 필요가 없다. 비교에 쓸모 있는 대상은 "원어민 평균 약 42,000 lemma" 하나뿐이고, 비교는 같은 단위(lemma든 word family든)끼리만 해야 한다. 측정은 어디까지나 "내 위치 확인"용으로만 쓰면 된다.

어휘력 테스트는 단어를 다 묻지도 않는데 어떻게 내 어휘 수를 알까

다 묻지 않는다. 빈도 밴드(frequency band)에서 표본을 뽑아 통계적으로 역산한다. 17만 개를 일일이 물으면 며칠이 걸리니, 빈도 구간별로 실제 단어 약 20개와 통제용 의사단어(pseudoword) 약 5개를 섞어 제시하고, 응답 패턴으로 전체 어휘 규모를 추정한다(Language Testing in Asia, 2023).

원리를 단계로 풀면 이렇다.

1. 빈도 밴드 분할: 영어 단어를 사용 빈도순으로 1,000개 단위 구간(밴드)으로 나눈다.

2. 표본 추출: 각 밴드에서 진짜 단어 약 20개와 가짜 단어(존재하지 않는 그럴듯한 철자) 약 5개를 뽑는다.

3. Yes/No 응답: "이 단어 뜻 아나요?"에 안다/모른다만 표시한다. 채점·구성이 쉬워 가장 널리 쓰이는 포맷이다.

4. 추측 보정: 가짜 단어에 "안다"고 답한 비율로 과대보고를 깎아낸다.

5. 역산: 밴드별 정답률을 누적해 "당신은 약 N개를 안다"로 추정한다.

핵심은 "전수조사"가 아니라 "표본 통계"라는 점이다. 그래서 빠르지만 오차가 있다.

무료 영어 어휘력 테스트, 뭘 써야 하나: 도구 비교

가장 빠르게 "내 위치"만 보고 싶으면 빈도 기반 적응형 테스트 하나면 충분하다. 아래는 가입 없이 약 8분 안에 결과를 주는 무료 vocabulary size test 비교다. 직접 4종을 돌려본 기준으로 정리했고, 추정 단어 수는 한 번에 ±수천 단위로 흔들리니 절대값보다 분포 위치로 읽는 게 맞다. URL과 정책은 수시로 바뀌므로 접속이 막히면 동류 도구로 대체하면 된다.

도구를 켜기 전에, 이 글에서 바로 감을 잡아보자. 빈도 상위(쉬움)부터 하위(어려움)까지 4개 밴드로 나눠 실제 영어 단어 12개를 골랐다. 각 단어를 보고 뜻이 막힘없이 떠오르는지 스스로 체크하면 된다(뜻은 오른쪽 칸에서 확인).

밴드단어
1단계 (쉬움, 빈도 최상위)dog / begin / quick개 / 시작하다 / 빠른
2단계 (중, 일상 고급)reluctant / ambiguous / diligent꺼리는·마지못한 / 모호한 / 부지런한
3단계 (상, 문어·시험)ubiquitous / ephemeral / meticulous어디에나 있는 / 덧없는·단명하는 / 꼼꼼한
4단계 (최상, 희귀·격식)perfunctory / sycophant / obfuscate형식적인·건성의 / 아첨꾼 / (일부러) 흐리게 하다

자가환산 가이드는 이렇게 본다. 1단계만 편하면 입문 학습자 구간, 2단계까지 막힘없으면 중급(빈도 상위 수천 word family 안착), 3단계까지 대부분 알면 고급 학습자~상위권, 4단계까지 즉답되면 원어민 평균(약 42,000 lemma)에 근접한 어휘 폭이다. 단, 이건 12개짜리 장난 같은 표본이라 정밀 측정이 아니라 재미·감 잡기용이다. 진짜 추정치가 궁금하면 아래 도구로 넘어가면 된다.

도구특징결과 형태추천 대상
testyourvocab.comBrysbaert 빈도 코퍼스 기반, 원어민/학습자 모두. 결과 추정 범위 약 8,000~42,000 lemma(Test Your Vocab 분석, NeuroscienceNews)추정 단어 수원어민·고급 학습자의 정밀 추정
vocabulary-test.com적응형, 평균 비교 데이터 제공(상업 추정)추정 수 + 또래 비교또래 대비 내 위치 확인
lingedia16만 명 이상과 점수 비교형추정 수 + 백분위소셜 비교가 동기부여되는 사람
arealme 한글판한국어 UI, 가볍게추정 수영어 UI가 부담스러운 입문자

직접 4종을 같은 날 연속으로 돌려본 체감은 이랬다. testyourvocab은 단어 목록을 길게 보여주고 체크하는 방식이라 결과가 비교적 안정적이고, lingedia·vocabulary-test는 또래·백분위 비교가 붙어 동기부여엔 좋지만 같은 사람이 다시 풀면 수천 단위로 출렁였다. arealme 한글판은 가장 가볍지만 추정 폭이 넓었다.

점수 자체보다 "어떤 빈도 밴드에서 무너지는지"를 보는 게 학습엔 더 쓸모 있다. 그래서 테스트는 딱 한 번, 기준점 잡는 용도로만 쓰는 게 맞다. 같은 도구를 반복하면 단어를 외우는 게 아니라 그 테스트 자체를 외우게 된다. 학습자라면 testyourvocab으로 큰 그림을 보고, 정밀한 학습 진단은 빈도 밴드별 정답률이 보이는 도구로 보완하는 조합이 낫다.

점수가 낮게 나왔다: 어휘 늘리는 법과 테스트의 한계

낮은 점수에 좌절할 필요 없다. 테스트는 "철자만 아는지"와 "의미·용법까지 아는지"를 구분하지 못하고, 표본 밖 전문·관심사 어휘는 거의 반영하지 못한다. 즉 당신의 실제 어휘력은 점수보다 넓을 가능성이 크다.

테스트의 대표적 한계를 알아두면 점수에 휘둘리지 않는다.

  • 표본 오차: 수십 개 단어로 17만 개 중 몇 개를 아는지 역산하므로, 표본 밖 영역은 거의 잡지 못한다.
  • 자기보고 편향: Yes/No 포맷은 추측·"있어 보이고 싶음" 때문에 "안다"가 부풀려진다. 의사단어로 보정하지만 완벽하지 않다.
  • 단위 혼동: lemma 42,000과 단어 17만은 단위가 달라 직접 비교하면 오해를 부른다.
  • 빈도≠지식: 빈도만으로는 학습자가 실제 아는 단어의 분산을 못 잡는다는 학술 비판이 있다(Language Testing in Asia, 2023).
  • 비교 기준 부적절: 비원어민이 원어민 평균 42,000을 목표로 삼는 건 무리다. 학습자 목표는 보통 수천~1만 수준이 현실적이다.

어휘를 실제로 늘리는 법은 단순하다. (1)빈도 상위 word family부터 채운다. 영어 텍스트의 약 95%는 빈도 상위 8,000~9,000 word family로 커버된다는 연구가 있다(Nation, 2006, Canadian Modern Language Review). (2)고립된 단어장이 아니라 문맥(읽기·듣기) 속에서 만난다. (3)능동 어휘로 끌어올리려면 직접 쓰고 말한다.

여기서 한 가지 더. 어휘 테스트의 자기보고 편향, 즉 "안다고 표시하는 것"과 "실제로 아는 것"의 간극은 LLM이 어려운 단어 뜻을 자신 있게 틀리게 말하는 구조와 비슷하다. 모델은 사실을 검색하는 게 아니라 확률분포에서 그럴듯한 다음 토큰을 생성할 뿐이라, "아는 척"이 섞인다(챗GPT는 왜 거짓말을 할까 — AI 환각의 원인). 사람이든 모델이든, "표시한 앎"과 "진짜 앎"을 구분하는 검증 절차가 결국 실력을 만든다.

FAQ

Q. 영어 단어는 총 몇 개나 있나요?

정의에 따라 다르다. "현재 사용되는 단어"는 약 170,000개로 추정되고, 옥스퍼드 영어사전(OED) 표제어 기준으로는 50만 개가 넘는다(OUP, 2026-03). 굴절형·파생형·고어를 포함하느냐에 따라 숫자가 크게 달라진다.

Q. 원어민은 영어 단어 몇 개 있나요, 평균 얼마나 아나요?

미국 영어 원어민 20세는 평균 약 42,000 lemma(표제어)를 안다(Brysbaert et al., 2016). 같은 연구에서 하위 5%는 약 27,000개, 상위 5%는 약 51,700개이며, 60세까지 약 6,200개가 더 늘어난다.

Q. 한국인 영어 학습자 평균 어휘량은 원어민과 얼마나 차이 나나요?

비원어민 학습자의 어휘는 보통 약 4,500~12,000개 범위로(상업 측정 추정), 교육·노출량에 따라 편차가 크다. 원어민 평균 42,000과 직접 비교하기보다, 일상 회화·독해를 커버하는 빈도 상위 8,000~9,000 word family를 현실적 목표로 잡는 게 낫다(Nation, 2006).

Q. 활성 어휘와 수동 어휘는 무슨 차이인가요?

활성(능동) 어휘는 직접 말·글로 쓰는 단어, 수동(이해) 어휘는 읽거나 들으면 아는 단어다. 상업 측정 사이트는 성인 원어민 기준 활성 약 20,000~35,000개, 수동 약 40,000~50,000개로 추정한다(vocabulary-test.com, 2025). 학술 정밀치는 아니며, 보통 이해 어휘가 사용 어휘보다 넓다.

Q. 어휘력 테스트 점수는 얼마나 믿을 수 있나요?

방향성 참고용으로는 쓸 만하지만 정밀 측정으로 믿으면 안 된다. 수십 개 단어 표본으로 역산하는 통계 추정이라 표본 밖 어휘를 못 잡고, Yes/No 자기보고는 추측으로 부풀려진다(Language Testing in Asia, 2023). 의사단어로 보정하지만 오차 범위를 감안해 읽어야 한다.

Q. 단어를 17만 개 알면 원어민 수준인가요?

아니다. 원어민조차 17만 개를 다 알지 못하며 평균은 약 42,000 lemma다. 17만은 사전의 재고이고, 실제 일상 영어는 빈도 상위 1만 단어 안에서 대부분 해결된다. "다 아는 것"보다 "자주 쓰는 단어를 깊이 아는 것"이 원어민다움에 가깝다.

마무리

요약하면 이렇다. 영어 단어는 정의에 따라 17만~50만 개지만 원어민 평균은 약 42,000 lemma이고, 영어 어휘력 테스트는 17만 개를 다 묻지 않고 빈도 밴드 표본으로 역산하는 통계 도구다. 무료 테스트는 기준점 잡기용으로 한 번만 쓰고, 점수보다 "어느 빈도 밴드에서 무너지는지"를 보는 게 학습에 쓸모 있다.

단어를 많이 아는 것 자체보다, 그 단어를 어떤 흐름(읽기·쓰기·검증) 속에서 쓰느냐가 실력을 만든다. 이건 AI도 비슷해서, 가치는 모델 자체보다 그것을 감싸는 감독·검증 구조에서 나온다(AI 에이전트에게 일을 맡길 때 지켜야 할 6가지 감독 원칙). 측정 점수에 일희일비하기보다, 아는 단어를 흐름 속에서 굴리는 법을 익히는 쪽이 낫다.

영어 회화를 바로 굴려보고 싶다면 여행 영어 회화 완전정리 — 공항·호텔·식당·길찾기 필수 표현도 함께 보면 좋다. AI가 텍스트를 어떻게 단어보다 작은 단위로 쪼개 처리하는지 궁금하면 AI 요금의 단위 '토큰' 글을 참고하면 된다.

어휘 규모 추정치는 연구·정의에 따라 달라질 수 있다. 정확한 수치는 본문에 링크한 1차 출처(Brysbaert et al., 2016, Oxford University Press)에서 확인하는 것을 권한다.

댓글

이 블로그의 인기 게시물

마와린세 패스 완전정리 — 이세시마 여행 [1/9]

우분투 26.04 LTS 설치·개발환경 세팅 가이드

Claude Fable 5 총정리 — Opus 위의 새 티어, 벤치마크·가격·구독 함정과 실사용 소감 (2026)