ア | イ | ウ | エ | オ |
カ | キ | ク | ケ | コ |
サ | シ | ス | セ | ソ |
タ | チ | ツ | テ | ト |
ナ | ニ | ヌ | ネ | ノ |
ハ | ヒ | フ | ヘ | ホ |
マ | ミ | ム | メ | モ |
ヤ | ユ | ヨ | ||
ラ | リ | ル | レ | ロ |
ワ | ヰ | ヴ | ヱ | ヲ |
ン |
A | B | C | D | E |
F | G | H | I | J |
K | L | M | N | O |
P | Q | R | S | T |
U | V | W | X | Y |
Z | 数字 | 記号 |
言語学上はアルタイ諸語に属する言語ではないかとする説があったが、現時点でもまだ確立した理論はない。つまり言語学上の系統は不明扱いで、日本語のみを含む「日本語族」というカテゴリーに含める学者もいる。
文法上の類似点だけで見れば、近隣国の朝鮮語などに近縁関係を見るが、単語レベルとなると類似性に乏しい。近隣諸国の言葉と、あまり共通点が見られないのは一つの特徴といえる。
日本語は、元々は「やまとことば」と呼ばれる文字の無い言語である。
この起源が今も謎となっているのだが、基本的な文法はアルタイ諸語に準じているが、各種の要素にアルタイ諸語にはない南島語由来と思われるものを含む。このため、アルタイ諸語と南島語の混合が起源なのではないかと考える学者が多いが、その起源を証明するまでには至っていない。
やがて、支那から「漢字」が伝えられ、この文字で「やまとことば」を表現しようとした所から日本語の文字表現が生まれた。
この時の工夫から、漢字の読み方も一つではなく音読みと訓読みが作られ、さらに、宛て字と呼ばれる自由度の高い熟語読みが作られた。このため仏蘭西と書いてフランスと読む、といった事も可能である。
この語族の特徴である主語+述語+動詞という、動詞が主語や目的語のあとに来る言語であるが、多くの場合において主語や目的語が省略される。
常に、省略された語を考えなければならないので、日本人は発想力が豊かになるはずであるが、現代の若者は欧米かぶれのためか教育が悪いのか、発想が貧困である。
文字表記は、ひらがな、カタカナ、アルファベットという三種の表音文字と、漢字、数字、という二種の表意文字から成る。
このため非常に表現力が高い言語であり、「inu」と表記するにも、いぬ、イヌ、犬、など数多くの表記ができ、それぞれに微妙なニュアンスを表わすことができる。
全文字を網羅した文字配列として、「いろは」と「あいうえお(五十音図)」が知られる。前者は意味を持った詩になっていることから人為的な作品と考えられ、平安期に成立したとされる。後者も、梵字を起源として平安後期に原型が作られている。古来はイロハの方が一般的であったが、現代では五十音図に準じるのが一般的で、電算機における文字符号の配列も後者に従う。
カタカナは、漢字の一部を取って作られた文字である。例えばアは阿の偏、イは伊の偏、ウは宇の冠、エは江の旁、オは於の偏から作られた。
ひらがなは、漢字を草書化したもので、多くの異体字がある。現在使われているのはこのうち、1900(明治33)年施行の小学校令施行規則によって便宜的に整理、統一されたものである。
この統一から漏れた書体を「変体仮名」というが、例えば蕎麦屋の看板の「生そば」の表記として今でもよく見られる。
日本語文字は、かな文字以前にも存在したとする仮説がある。このように、漢字伝来以前に古代日本で使用されていたとされる、日本独自の文字を総じて神代文字という。但し今では、その存在は殆ど信じられていない。
例えば、対馬からは阿比留文字(アヒル文字)と呼ばれる文字が発掘されている。この文字は現代日本語では使われていないが、非常に古い神社などに見つかっており、創建703(大宝3)年の宮崎県の円野神社などにも見られる。
この文字についてはまだ起源や正体は明らかではないが、とにかく古い時代からあったことは確実なようである。現時点では学術的な根拠は薄いものの、後に東支那半島(朝鮮半島)で使われる文字ハングルの起源になったとする説もある。
また英語の「You」一つとってみても、日本語では、君、お前、貴殿、貴様、あなた、あんた、われ…と、実に多彩多様な表現ができる。
日本語は微妙な表現に長けた言語なのである。
発音は5母音(aiueo)と数が少ないうえに、子音の数も清音直音だけで言えば9つ(kstnhmyrw)しかない。
このため日本語は、会話手段としての言語で見れば非常に修得しやすい言語である。
しかし、発音が単純なことから同音異義語が多く、たとえば「iru」という言葉一つとっても、「入る」「居る」「要る」「煎る」「射る」「鋳る」など数多くの単語が存在する。
各単語はアクセントで区別されるが、アクセントすらも同じ語もあるので、前後の語からの判断も必要となる。
語彙の面から見れば、日本語は非常に柔軟に外国語を取り入れる。
取り入れる際、その語をカタカナで表記する。そして「する」というサ変動詞をつけることで動詞化し、「だ」という形容動詞語尾をつけることで形容動詞化する。
動詞については時として、サボる(←サボタージュする)、ネグる(←ネグレクトする)のように、省略して五段動詞化することもある。
こうして日本語は語彙が無数に増えるが、当然死語というものが出てくるため、全体として見たときの語彙数の増減はあまりないらしい。
カタカナの存在は外来語のスムーズな取り込みに一役も二役も買っているが、何でもカタカナのままの「あまり日本語になってない語」を誘発してしまう問題もある。特に電子計算機用語はこの傾向が強く、当然改善が望まれている。
例えば、「Microsoft Windowsプラットフォームで動作するアプリケーションの、コンパチビリティを保つためのビルド管理」。わけが分からない。
だからといって、何でも日本語訳を実際に行動に移すと、IBM語と蔑称されてしまい、結局普及しない。例えば、3.5インチフロッピーディスクドライブ→3.5型駆動機構。やっぱりわけが分からない。
ちなみに現在の標準語は東京の山の手あたりの言葉であるが、それ以前の標準語は京都であった。
現在の標準語が一世紀程度の歴史であるのに対し、京都の歴史は古く平安朝までさかのぼる。このため現在では「京都弁」と方言の一つで数えられるが、現代の標準語こそが田舎臭い方言だと主張する者もいる。
アクセントについては大きく4つに分かれ、次のどれかに分類される。
簡単に言ってしまえば、大阪式と東京式はアクセントがほぼ逆である。
なお特徴的なアクセントとして、現代の若者言葉におけるアクセントがあげられる。たとえば、/彼氏/[↓↑↑] (正しくは[↑↓↓])などは、地方から東京に出てきた人間がアクセントを東京式にしようとして、何でも語を平板化した結果生まれたものだと考えられている。
日本語は文字が多いため、電子計算機では、文字集合(CCS)と文字符号(CES)を分けて考えている。
現在は主に文字集合(CCS)として、次のようなものが使われる。
文字符号(CES)には、次のようなものが使われる。
コメントなどを投稿するフォームは、日本語対応時のみ表示されます