영어 지문 난이도 측정 · 수능 등급 · CEFR 매핑

5종 가독성 지수, 수능·TOEIC·CEFR·Lexile 매핑 원리, 오차 범위, 학습 단계별 활용까지 정리.

1. 본 도구가 계산하는 5종 가독성 지수

영어 가독성 공식은 1948년 Rudolf Flesch가 미 해군 매뉴얼의 가독성을 평가하기 위해 도입한 이래 70여 년간 의학·교육·언론·법률 분야에서 다듬어진 공개된 공식입니다. readlvl 은 이 중 가장 널리 검증된 6개를 한 번에 계산합니다. 원문은 외부로 전송되지 않고 브라우저에서 즉시 처리되므로, 저작권이 있는 학원 교재나 외부 공개가 곤란한 모의고사 지문도 안심하고 붙여 넣을 수 있습니다.

지수	공식 핵심	해석
Flesch Reading Ease	문장 길이 + 음절/단어	0~100, 높을수록 쉬움. 60 이상이면 일상 영어, 30 미만이면 학술 논문급.
Flesch-Kincaid Grade	평균 문장 길이 + 음절	미국 학년(grade). 10 = 고1, 12 = 고3, 13+ = 대학 1학년 이상.
SMOG Index	3음절 이상 단어(polysyllable) 비율	의료 동의서 가독성 평가용으로 개발. 학술·전문 지문에 특히 민감.
Gunning Fog	복합 단어(complex word) 비율	비즈니스·언론 지문 평가에 사용. 8~12가 '일반 독자 친화' 목표선.
Coleman-Liau	문자 수·문장 수 기반	음절 추정 오차에 강해 OCR 결과나 비전형 단어가 많은 지문에 적합.
Dale-Chall	어려운 단어 비율(3,000 easy words 밖)	어휘 난도에 민감. EBS 연계 지문의 어휘 부담 측정에 특히 유용.

2. 수능 등급 1~9로 매핑하는 방식

한국 수능 영어는 2018학년도 절대평가 전환 이후에도 지문 난이도는 대체로 Flesch-Kincaid Grade 9.5 ~ 12.5 구간에 분포합니다. 평가원 공식 자료에 따르면 2023~2025학년도 수능 영어 본문 평균 문장 길이는 16.8~18.4단어, 평균 음절은 1.62 내외였습니다. readlvl 은 5종 지수의 학년(grade) 평균과 FRE·CEFR 추정치를 교차 검증해 1~9등급으로 매핑합니다.

1등급: 평균 학년 13+ · C1 이상 · FRE 40 미만 — 고난도 추론·학술·문학 지문 (수능 21·34번 빈출)
2등급: 평균 학년 11.5~13 · B2~C1 · FRE 40~50 — 빈칸·순서 핵심 지문
3등급: 평균 학년 10~11.5 · B2 · FRE 50~60 — 수능 평균 본문 난이도
4~5등급: 평균 학년 8~10 · B1~B2 · FRE 60~70 — 도입부·실용문 지문
6~9등급: 평균 학년 8 미만 · A2~B1 · FRE 70+ — 초기 도입·안내문 지문

주의: 수능 공식 등급은 지문 난이도뿐 아니라 문제 유형·선지 함정·전국 응시자 분포까지 포함되므로, readlvl 의 매핑은 지문 자체의 텍스트 난이도에 국한된 추정입니다. 같은 지문이라도 빈칸 유형이냐 일치/불일치냐에 따라 체감 등급은 1~2등급씩 달라질 수 있습니다.

3. TOEIC RC · CEFR · Lexile 매핑 근거

CEFR (A1~C2): 공개된 Flesch-Kincaid → CEFR 대응표(Council of Europe, 2018)와 readlvl 내장 CEFR 단어 사전의 고급 어휘 비율을 결합해 추정합니다. C-level 어휘 비율이 25% 이상이면 한 단계 상향 조정합니다.
TOEIC RC 점수: ETS 가 공개한 CEFR 중심값(A2≈200, B1≈310, B2≈395, C1≈460, C2≈490) 을 기준으로 평균 학년으로 세부 조정. ETS Compendium 2023 RC 대역 분포 기준입니다.
Lexile: MetaMetrics 공개 grade→Lexile 대응식(1학년 ≈ 200L, 8학년 ≈ 1020L, 12학년 ≈ 1200L) 을 활용. FRE 극단값(95+ / 25-)에서 ±60L 보정합니다.

4. 오차와 한계 — 점수만 보지 말 것

음절 수 추정은 영어 철자 기반 휴리스틱이므로 일부 단어(예: simile, people, chaos)는 예외 사전으로 보정합니다. 그래도 ±0.1 음절/단어의 노이즈는 남습니다.
고유명사(Tom, Seoul, iPhone)는 어려움 판단에서 제외해 Gunning Fog·Dale-Chall 과대계산을 방지합니다.
매우 짧은 지문(10단어 이하)은 SMOG 공식이 수학적으로 불안정하므로 평균 학년에 가중치를 적게 반영합니다.
매핑의 절대 오차는 ±1등급(수능) / ±50점(TOEIC) / ±80L(Lexile) 정도이며, 결과 상단에 항상 표기됩니다.
가독성 지수는 문장 표면의 길이·어휘를 측정할 뿐, 지문이 다루는 개념(예: 양자역학, 윤리학)의 추상도까지 잡지 못합니다. 단순한 단어로도 어려운 추론 지문이 가능하다는 뜻입니다.

5. 무엇을 할 수 있나 — 사용자별 활용

수험생: 학원 교재·모의고사 지문을 붙여넣고 본인 목표 등급과의 간극 확인. 9월 평가원 → 10월 학력평가 → 수능 흐름에서 난이도 분산이 어떻게 바뀌는지 한 학기 단위로 트래킹할 수 있습니다.
영어 교사·학원 강사: 학급 수준에 맞는 지문 선정. CEFR 분포 막대로 어휘 난이도 미리 확인. EBS 연계 변형 문제 출제 시 원본/변형 가독성 차이를 정량 비교.
콘텐츠 작성자: 블로그·뉴스레터 글을 업로드해 타겟 독자층에 맞추기. Lexile 800~1000L 구간이 일반 성인 독자 권장선입니다.
번역·편집자: 원문·번역문 가독성 차이 비교. 영-한 번역에서 원문이 B2여도 번역문이 C1로 튀는 흔한 함정을 정량 확인.

6. 한국 수능 영어 절대평가 시대의 지문 분포

2018학년도 절대평가 전환 이후 수능 영어의 1등급 비율은 10.0%(2018) → 7.4%(2019) → 12.7%(2021) → 6.3%(2024)로 등락이 컸습니다. 이는 평가원이 지문 난이도와 문제 유형 난이도를 매년 미세 조정해 1등급 비율을 5~12% 사이에서 통제하기 때문입니다. readlvl 로 EBS 연계 본문과 수능 본문을 비교하면, 본문 자체는 EBS 와 큰 차이가 없으나 선지 어휘가 평균 0.3~0.5 등급 더 높다는 패턴이 보입니다. 이 차이를 학원가에서는 "EBS 가독성 갭" 이라 부르며 변형 문제 출제의 출발점으로 삼습니다.

7. 학습 단계별 추천 Lexile · CEFR 가이드

가독성 지수를 학습 계획에 접목하려면 본인의 현재 수준보다 약 +50~+100L 높은 지문을 80% 비중으로, 동등 수준 지문을 20% 비중으로 섞는 것이 효율적입니다. 너무 쉬운 지문은 어휘 확장이 안 되고, 너무 어려운 지문은 추론 속도가 무너집니다.

초등 5~6학년: Lexile 400~600L · A2 후반. I Can Read Level 3, Roald Dahl 단편 발췌가 적정선.
중1~중2: Lexile 600~850L · A2~B1. 짧은 뉴스 기사(VOA Learning English), Magic Tree House 시리즈.
중3~고1: Lexile 850~1050L · B1~B2. TIME for Kids, 일반 신문 칼럼 축약본, 수능특강 도입 지문.
고2~고3: Lexile 1050~1250L · B2~C1. 수능 본문, The Economist 중급 칼럼, Scientific American 일반 기사.
대학생·일반: Lexile 1250L+ · C1~C2. 학술 논문 초록, The Atlantic 심층 분석, 영문 판례 요약.

8. 가독성 지수의 함정 — 점수 의존의 위험

FRE 75점, B1 급 지문도 학생이 못 읽을 수 있고, FRE 30점 C1 지문도 학생이 술술 읽을 수 있습니다. 가독성 점수는 표면 통계일 뿐 다음 요소를 잡지 못합니다.

배경지식 의존도: 양자역학·헤겔 변증법 지문은 단어가 쉬워도 어렵습니다.
문화·관용표현: break the ice, kick the bucket같은 표현은 음절·학년 공식에 잡히지 않습니다.
논증 구조: 대조·인과·예시의 흐름이 명확하면 어휘가 어려워도 잘 읽힙니다.
선지 함정: 수능 빈칸의 오답 선지는 본문보다 1~2등급 어려운 어휘로 구성되는 경우가 많습니다.

readlvl 은 이 한계를 명시적으로 안내하고, 지문 자체의 난이도와 학습자가 체감하는 난이도를 구분해 사용할 것을 권장합니다.

9. AI 시대의 영어 독해 학습과 가독성 도구

2024~2026년 사이 LLM 번역기·요약기가 일상화되면서 학습자의 영어 입력 양은 오히려 늘었습니다. readlvl 은 LLM 으로 요약한 지문, AI 가 변형한 지문, 챗봇이 작성한 학습 자료의 난이도를 정량 측정해 "이 LLM 요약본은 원문보다 1등급 낮다" 같은 객관적 판단을 가능하게 합니다. 특히 ChatGPT, Claude, Gemini 가 생성한 영어 지문은 모델별로 평균 학년이 0.7~1.2 등급씩 다르므로, 학습자가 의도한 난이도와 일치하는지 매번 확인하는 것이 안전합니다.

10. readlvl 사용 워크플로우 예시

붙여넣기: 학원 교재 한 단원(500~1,500단어)을 메인 입력창에 붙여넣기.
해석: 수능 등급/CEFR/Lexile 카드 동시 확인. 의도한 학습 단계와 비교.
가장 어려운 문장 3개 검토: 단어·구조 어디서 막히는지 확인.
CEFR 분포 막대: B2~C1 어휘 비중이 너무 높으면 어휘 학습부터 권장.
결과 복사: 결과 텍스트를 학원·과외 단톡방에 공유하거나, 학습 일지에 기록.
주간 트래킹: 매주 같은 출처에서 5개 지문을 측정해 본인 학습 진도와 교재 난이도 변화를 따라가기.

자세한 Q&A는 FAQ 를 확인하세요.