단어 대 구, 몇 대 몇?
≪우리말샘≫ 사전 통계
2016년 10월에 개통한 ≪우리말샘≫은 국민 누구나 편찬에 참여할 수 있는 개방형 사전입니다. 언어 사전으로는 세계적으로도 유례가 없는 새로운 시도인데요. 다행히 많은 국민들의 관심과 참여로 무럭무럭 자라고 있습니다. 2019년에 ≪우리말샘≫을 찾은 사람은 모두 9,088,175명입니다. 하루 평균 8,400명 정도가 방문한 셈인데요.
그럼 ‘숫자로 살펴보는 ≪우리말샘≫’을 본격적으로 시작해 보겠습니다.
단위별 현황
2016년 10월 표준어를 비롯해 신어, 지역어, 전문용어 등 다양한 분야를 아우르며 100만 어휘로 출발한 ≪우리말샘≫은 그동안 꾸준히 표제어를 추가하며 2020년 1월에는 1,117,782개의 표제어를 담고 있습니다. 이 중 단어는 735,962개이고 구는 381,820개입니다. 이때 단어에는 ‘헛-’, ‘-습니다’, ‘지자체’와 같은 접사, 어근, 어미 등과 구 구성이 줄어든 한 어절 표제어를 포함합니다. 구는 ‘교통 체증’, ‘손 없는 날’처럼 ’띄어 쓴 표제어와 띄어 쓰는 것이 원칙인, 두 어절 이상의 표제어를 가리킵니다.

품사별 현황
≪우리말샘≫에 실린 어휘들은 명사, 동사, 부사, 형용사 순으로 많습니다. ≪표준국어대사전≫에는 명사(268,220개), 동사(56,187개), 형용사(13,374개), 부사(12,286개)의 순으로 많은데요, 부사와 형용사의 순위가 다르다는 점이 재미 있습니다. ≪표준국어대사전≫의 사전 통계가 궁금하시다면 ‘이곳’을 눌러 주세요!


지역별 현황
≪우리말샘≫에서는 남북한뿐만 아니라 ‘바둑호랭이(표범, 길림성)’, ‘소스락비(가랑비, 요령성)’, ‘코따따리(코딱지, 흑룡강성)’, ‘시걱거두매(설거지, 중앙아시아)’처럼 재외 동포들이 쓰고 있는 방언들까지 찾아볼 수 있습니다. ≪우리말샘≫에 실린 방언은 135,808개라고 하는데요. 그렇다면 지역별 현황은 어떨까요?

원어별 현황
단어는 원어에 따라 고유어, 한자어, 외래어, 혼종어로 나뉩니다. 혼종어는 둘 이상의 원어로 구성된 것을 가리키는 말인데 ‘생일 파티(生日party)’, ‘산타 할아버지(Santa 할아버지)’, ‘컴퓨터화하다(computer化하다)’ 등이 있습니다.
고유어는 254,169개, 한자어는 307,157개, 외래어는 50,231개, 혼종어는 124,365개가 각각 실려 있습니다. 그중 외래어로는 영어(67,931개)부터 프로방스어(1개)까지 46가지 원어가 수록되어 있습니다.



다중 매체 정보의 유형별 구축 현황
≪우리말샘≫에는 표제어의 발음과 함께 사진, 동영상 등 다중 매체 정보도 있답니다. 모든 표제어에서 제공되진 않지만, 글만으로는 이해하기 어려운 뜻풀이가 있을 때, 사진이나 동영상을 함께 참고한다면 그 뜻을 이해하기 훨씬 쉽겠죠.
예를 들어 ‘그림자놀이’는 “사람 또는 동물의 모양을 불빛으로 흰 막이나 흰 벽 위에 비치게 하여 움직이는 그림자가 나타나게 하는 놀이”로 뜻이 풀이되어 있습니다. 글만으로도 이해하기에 부족함이 없지만 아래와 같은 동영상과 함께라면 더욱 실감 나겠죠?

≪우리말샘≫은 누구나 표제어를 올리거나 뜻을 수정할 수 있고, 사회 변화에 따라 생겨나는 말들도 빠르게 실을 수 있습니다. ≪우리말샘≫에서만큼은 전 국민이 사전 편찬자가 되는 셈이지요. 미처 다 소개하지 못한 ≪우리말샘≫ 관련 통계는 아래 주소에서 확인할 수 있습니다.
저작권 걱정 없이 누구나 자유롭게 활용할 수 있는 ≪우리말샘≫, 많은 관심과 방문 부탁드려요!
