Pojmy hláska a foném jsou v dialektické jednotě : foném poznáváme jen skrze jeho realizace - hlásky, hlásky však v řečovém proudu identifikujeme na základě jejich vztahu k fonému jako jednotce fonologického systému.
Tento přístup není ovšem jediný možný - jednotlivé fonologické školy mohou při identifikaci fonému preferovat obecnou pozici v systému, jeho zapojitelnost v morfému apod. a od reality abstrahovat; zde vycházíme z pojetí tradičního, jeho pochopení umožní vyrovnat se později i s jinými pojetími.
Jeden foném se v řeči může realizovat více než jedním foném. Množinu zvukových realizací chápaných v rámci jednoho jazykového útvaru účastníky komunikace jako realizace téhož fonému nazýváme alofony jednoho fonému; vedle toho existují i jeho další varianty, které již nejsou pravidelné (viz dále).
V češtině např. ztotožňují mluvčí různé alofony fonému /n/. Za jediný foném pokládají zvuk ve slovech [hana] i [haŋka], ale i ve slově [utne], kde dochází mezi [t] + [n] ke koartikulaci, ve slově [punci:k] = puntík, kde mnozí mluvčí vyslovují [n]+[c] jedním artikulačním pohybem (jakoby "puňťík"), a v nespisovné výslovnosti i [m] ve slově hanba - vyslovováno jako [hamba].
Fóny patřící k jedinému fonému mají alespoň některé společné zvukové vlastnosti.
V češtině jsou např. všechny realizace fonému /l/, označované jako "tvrdší", "měkčí", "změkčené" (jde o změny znění založené na proměnách místa artikulace a postavení jazyka), vyslovovány bokově.
Složitější je situace v ruštině při redukci, kde se /a/ i /o/ vyslovují společně zvukem [ə], který se [a] ani [o] nepodobá.
Alofony lze rozdělit na základní alofon, poziční alofony a ostatní varianty. Pro popis jazyka jsou důležité alofon základní a alofony poziční; od ostatních variant se většinou abstrahuje, mohou se sledovat na fonetické úrovni, a to především v aplikované fonetice.
Základní alofon (základní realizace fonému) realizuje maximum diferencujících vlastností fonému. Je jen minimálně závislý na hláskovém okolí. Tento základní alofon je pro účastníky komunikace typickým reprezentantem fonému a při popisu fonému se vychází z jeho artikulačních a akustických vlastností. Výběr základní realizace fonému je závislý na zákonitostech zvukové realizace jazyka.
V češtině se např. vokál při realizaci málo přizpůsobuje okolním souhláskám, každá z jeho pozic může být pokládána za "základní". V jazycích se silným přízvukem se naopak vokál v nepřízvučné pozici mění, "základní" může být pouze pozice přízvučná. Z toho plyne, že obecný návod na identifikaci základní pozice fonému těžko vytvoříme, musíme se řídit podmínkami konkrétního jazyka.
Poziční (kombinatorní, kombinatorické, závislé) alofony jsou ty realizace fonému, které jsou modifikovány vlivem hláskového okolí. Jsou většinou v jazyce závazné, a jejich realizace je tedy obligatorní. Pokud jsou jen fakultativní, mohou být využity stylově nebo prozrazovat oblastní původ mluvčího.
Typickým příkladem kombinatorního alofonu je v češtině výslovnost /m/ jako retozubného, následuje-li po /m/ retozubná souhláska (typ tramvaj, limfa). V jiných pozicích se přitom takový zvuk neobjevuje.
Problémem může být výběr základního alofonu např. u souhlásek podléhajících asimilaci znělosti. Tradičně se tu předpokládalo, že foném poznáme podle toho, že může být v tomtéž slovním základě (v postavení mezi vokály) realizován znělou hláskou - např. ve slově [sut] - [sudem]; bez ohledu na aktuální výslovnost jde v tradičním pojetí o realizaci fonému /d/. Nověji se v těchto případech mluví o substituci (náhradě, záměně) fonému, případy se chápou na fonologické úrovni jako záměna párových fonémů, která se v písmu neodráží. Je možné, že se v tradičním pohledu Čecha odráží i vědomí identifikace podstatných prvků jazyka související se zásadami pravopisnými.
Zvláštním případem využití kombinatorního alofonu jsou případy, kdy základní a poziční alofon stojí v komplementární (doplňkové) distribuci : pro tyto alofony platí, že se nemohou nikdy vyskytnout ve stejném hláskovém okolí.
V komplementární distribuci je v češtině realizace [n] a [ŋ]: velární [ŋ] se vyskytuje pouze před [k], [g], ev. [x], je tady kombinatorním alofonem fonému /n/ - ([vi:ŋko], [koŋgo]); v této pozici není vyloučena ani výslovnost základního alofonu - [n] alveolární, je však neobvyklá. V kombinatorním alofonu se realizuje jen část distinktivních rysů fonému : [n] i [ŋ] jsou nazální a okluzivní, místo tvoření však už při jejich ztotožnění do jediného fonému nehraje roli.
Ve zvláštních případech se může stát kombinatorním alofonem fonému nula - odpovídající hláska se v proudu řeči nerealizuje. I tu jsme s to foném poznat, a to především dík možnosti realizovat jej odpovídajícím alofonem při pečlivější výslovnosti.
V češtině dochází k takovým případům při zjednodušování souhláskových skupin : vyslovujeme např. implicitně [otse] (od slova otec), v explicitní výslovnosti však obě hlásky i vyslovíme - [otʦe]. : pozor - ʦ značí v IPA to, co v českém písmu -c-.
Ostatní varianty jsou charakteristické pro jednotlivé fonické podsystémy jazyka nebo promluvu jednotlivce. Jsou fakultativní a nejsou přímo závislé na hláskovém okolí. Tyto varianty mohou být rozděleny do několika skupin:
Stylové varianty jsou prostředkem fonické stylizace promluvy. Jsou v jazyce do jisté míry standardizovány: dokonalejší artikulace je např. typická pro slavnostní projevy, málo přesná artikulace s vypouštěním některých relací pro běžný výslovnostní styl. V některých jazycích existují i alofony scénické.
Emotivní varianty jsou způsobem fonického vyjádření emocionálního stavu mluvčího a přidávají k nocionální složce sdělení emotivní příznaky. Jsou v jazyce do jisté míry ustáleny.
Vzhledem k celku realizací obvyklých v národním jazyce můžeme hodnotit i jiné typy alofonů. Tak oblastní varianty jsou změny realizací fonémů nebo využití kombinatorních variant související s teritoriálním původem mluvčího. Jsou to vlivy fonologicko-fonetické stavby jiného útvaru národního jazyka a jsou společné větším skupinám obyvatel (v češtině např. výslovnost česká a výslovnost moravská). Jiné obměny ukazují sociální původ mluvčího (z angličtiny známá oxfordská výslovnost), mohou být i generační. Zvláštní skupinu tvoří individuální varianty.
Existují i jazyky, v nichž je minimální fonologickou jednotkou slabika (ve vietnamštině). Teoretickému vymezení fonému, které jsme podali výše, odpovídá v některých jazycích i suprasegmentální jev - slovní přízvuk, zvukový prostředek, který např. v ruštině odlišuje různá slova nebo slovní tvary. V ruských pracích bývá označován jako suprasegmentální foném.
U jazyků existujících na území velmi rozsáhlém se často liší i při shodném fonologickém systému typy alofonů natolik, že vzniká nový standard jazyka, ev. nová varieta (evropská a mexická španělština, různé standardy angličtiny, …