A nyelvi szintek közül a "legalsó", amelyen nyelvünk legkisebb elemei helyezkednek el, a fonémaszint. A fonéma a nyelvtudomány eszközeivel tovább már nem bontható egység, amelynek felismerhető formája van, de jelentés nem tartozik hozzá. (Ha a beszédhangokat tovább elemezzük, akkor ezt már csak a fizika vagy a biológia segítségével tehetjük meg, a betűket pedig a grafológia vizsgálja.) A fonémák összekapcsolásával ez a helyzet megváltozik: a fonéma jelentéshordozóvá válik. A fonéma ugyanúgy, mint a többi nyelvi elem, a belőle felépülő nyelvi egységben tölti be szerepét, tehát ha a morféma jelentése aszerint változik meg, hogy milyen fonémákból épül fel, akkor a fonémának is kell, hogy legyen valamiféle jelentéseleme. Az elfogyott és elfagyott, a szem és a sem, a lát és a lat, a hal és a hall vagy az irat és az írat közti különbség oka egy-egy fonéma eltérése. A fonémáknak tehát jelentés megkülönböztető szerepük van.
Egy nyelv fonémáinak a száma véges, könnyen számba vehetők, leírhatók. A magyar köznyelvi fonémarendszer tagjai a következők: a, á, b, c, cs, d, dz, dzs, e, é, f, g, gy, h, i, í, j, k, l, m, n, ny, o, ó, ö, ő, p, r, s, sz, t, ty, u, ú, ü, ű, v, z, zs. Az idegen hangok jelölésére szolgáló betűket, illetőleg a velük jelölt hangokat nem tekinthetjük a magyar fonémarendszer részének.
A fonéma elvont nyelvi egység, amely a nyelvhasználat során hang vagy betű formájában realizálódik (jelenik meg). A hangok a beszédfolyamatban mindig egyediek, aktuálisak, de közös tulajdonságaik alapján megkülönböztethetők bizonyos hangtípusok, amelyeket írásban többnyire ugyanazzal a betűvel jelölünk. A nyelvnek a legkisebb elemeit, amelyek a nyelvhasználat során hang vagy betű formájában jelennek meg, és jelentésmegkülönböztető szerepük van, fonémáknak nevezzük. A hangkörnyezet vagy a nyelvjárási viszonyok befolyásolhatják egyes hangok kiejtését, de a fonéma tulajdonságai állandóak maradnak (pl. tej - lépj, korong - nap, ettem - ëttem).
A kiejtésben vagy a helyesírásban nem mindig tükröződik a fonémák közötti különbség. Az irat és az írat a beszédben gyakran egyformának hangzik, a szëg (pl. vasszëg) és a szëg (pl. beszeg) ehangjai közti különbség is csak a nyelvterület egy részén érzékelhető. Ilyen és ehhez hasonló esetekben a szövegkörnyezet segít abban, hogy mondanivalónk egyértelmű legyen.
Az említett egybeesés felveti azt a kérdést is, hogy külön fonémának lehet-e tekinteni olyan hangokat, betűket, amelyeknek nincsen jelentésmegkülönböztető szerepük. A nyugat-dunántúli nyelvjárásban például a hosszú í, ú, űhangokat nem ejtik, nem beszélhetünk ezért jelentésmegkülönböztető szerepükről sem, sőt ily módon fonémaként sem léteznek. Ugyanez a helyzet a köznyelvben a kétféle e hanggal is. Bár egyes nyelvjárásokban használatuk jelentéskülönbséggel társul, a köznyelvi beszélő ezt nem képes érzékelni, helyesírásunk sem jelöli, ezért nem is számolunk kétféle e fonémával. A jhang jelölésére mai helyesírásunkban két betű is rendelkezésre áll (j és ly), de ezek mégsem önálló fonémák, hiszen jelentésmegkülönböztető szerepről beszélni csak akkor lehetne, ha hallható is lenne a köztük lévő különbség. A helyesírásban való megkülönböztetésük oka csak a hagyomány, s tanulás nélkül nem vagyunk képesek érzékelni köztük az eltérést.