Hangminőség-mérések (VoIP)

20.1
a hangminőség összehasonlításához és a hangminőséghez hozzájáruló paraméterek eléréséhez ismerni kell a hangminőség mérését és a minőségi célokat. A VoIP hangmérések alapvető tesztbeállítását a 13. téma tartalmazza. Ebben a témakörben a hangminőség mint átlagos vélemény pontszám( MOS), a különböző osztályozások, a hangminőséget befolyásoló paraméterek és a fejlesztések kerülnek megvitatásra. Az MOS hangminőségének mérése szubjektív és objektív.
néhány népszerű hangminőség-mérési technika funkcionális ábrázolását az ábra szemlélteti. 20.1 . Az ábrán látható, hogy a hang

20.1.táblázat. PSTN és VoIP minőség összehasonlítás

attribútumok PSTN VoIP
torzulások torzulások több miatt nincs analóg átvitel
analóg vonal 1000 láb vonalak torzulások VoIP hívásokat.
DLC vagy CO hely
Echo törlés veszteséggel hordozó minőségű echo cancellerek
nemzeti hívások esetén tervezés és alacsony késések használatosak.
automatikus erősítés nincs beépítve lehetséges beépíteni
ellenőrzés a beszéd jobb észlelése
szintek vagy hallgatási minőség
tapasztalat.
hangminőség Monitoring, mint a GR – RTCP-XR és GR – 909
monitoring 909 vannak beépítve beépítve sok VoIP
a PSTN telepítésekbe.
sávszélesség vagy bit 64 kbps rögzített digitális változó sávszélesség, általában
értékelés TDM. Dcme csatornák többet igényel a fizikai
használjon 16, 24, 32 és interfészeket, mint a PSTN. Fax
40 kbps, amely rontja a faxot a szolgáltatások többet kaphatnak
minőség sávszélesség vagy redundancia
adás.
Faxhívások teljesítmény korlátozott a rövid végvonalakat használ. Ezért fax
vége távvezeték a szállítás jobban használható
jellemzők VoIP. Azonban ott lehet
interoperabilitási problémák
fax küldése.
hang és adat főleg hanghívásokhoz, internetszolgáltatás és VoIP képes
egyes szolgáltatások újrafelhasználhatják a skálát az adatokkal és
hangcsatornák az adatokhoz médiaszolgáltatási követelmények.
Hanghívás funkciók korlátozott funkciók és számos funkciót kínálnak
drága több ingyenes.
szolgáltatási jellemzők
hang interfészek Korlátozott interfészek több interfész és szolgáltatás.
hosszú távolság hosszú távolság költséges általában ingyenes vagy sokkal alacsonyabb
árak.
átkódolás több szinten End-to-end közvetlen kódolás lehet
átkódolás inter – alkalmazott alapján a
regionális hívások elérhető támogatás.
szélessávú támogatás hanghívások a szélessávú end-to-end hang
keskeny sáv lehetséges, hogy meghaladhatja
PSTN minőség.

a küldő átjáró a fogadó átjáróhoz. A fogadó átjáró néhány kibővített blokkkal jelenik meg az e-modell nagy képének létrehozásához, amelyet R-faktor becsléshez, további minőségi mutatókhoz és valós idejű Transport Control Protocol-Extended Reports (RTCP-XR) művelethez használnak. Az e-modellben RTP, RTCP, jitter buffer és total system signal paramétereket használunk. Az R-faktor és más származtatott paraméterek kiszámításakor
áttekintés a népszerű hangminőség-mérésekről
20.1.ábra. Áttekintés a népszerű hangminőség-mérésekről.
az RTCP-XR képes csomagokat küldeni a belső alkalmazásoknak, a cél átjárónak és az RTCP-XR szervernek. Összefoglalva, a nem tolakodó R-faktor egy objektív becslés, amely a VoIP implementáció részeként található, és további szoftverre van szükség az átjáróban az R-faktor becsléséhez. A beszédminőség perceptuális értékelése (pesq) során az olyan eszközök, mint a MultiDSLA, a vizsgált VoIP rendszeren keresztül továbbítják a referencia beszédet, és értékelik a leromlott beszédet a referencia beszéddel. Ez a mérés aktív, és a VoIP átjáróknak semmit sem kell tudniuk a mérésről. Szubjektív hallgatás esetén több hallgató értékeli a hangminőséget. A P. 563-ban a hangot teljes egészében a vett degradált jelre elemzik, és az eredeti Referencia Nem szükséges. A P. 563 hasonló a szubjektív hallgatáshoz, de az eszközök vagy processzorok értékelik. Ezen technikák mindegyike eltérő hangminőségi skálán érkezik. Az A és B közötti VoIP hanghívás során a hangméréseket fél-duplexként végzik, ami azt jelenti, hogy a méréseket a-tól B-ig vagy B-től A-ig, egyenként végzik. A félduplex hallgatási típusú tesztelés miatt ezeket a méréseket hallgatási minőség (LQ) teszteknek nevezzük. Az LQ utótagot a félduplex tesztek eredményeinek bemutatása közben csatolják, az objektív teszteket pedig ” O “utótaggal egészítik ki LQO-ként.
20.1.1

szubjektív mérési technika

a szubjektív hangminőség értékelésében a hangminőség MOS-t a tényleges férfi és női hallgatók csoportja értékeli. Ez a tényleges hallgatási teszt a MOS értékeléséhez. A P. 800 és P. 830 ajánlások a beszéd
kodekek szubjektív teljesítményének értékelésére szolgálnak. Ugyanezek a tesztek kiterjednek a VoIP hangminőségre is. Az emberek egy csoportja részt vesz a szubjektív pontszámok rögzítésében. Több tesztmondatot rögzítenek, majd a tesztalanyok (emberek csoportja) különböző körülmények között hallgatják őket. Ezeket a teszteket speciális helyiségekben, háttérzajokkal végzik, és más környezeti tényezőket ellenőrzés alatt tartanak a teszt végrehajtása érdekében. A vizsgálati feltételek vannak megadva . A szubjektív mérési technikákat az abszolút kategóriaértékelésként (ACR), a degradációs kategóriaértékelésként (DCR) és az összehasonlító kategóriaértékelésként (CCR) kategorizálják.
I n ACR, a résztvevők több tesztkapcsolaton keresztül feldolgozott rögzített beszédmintákat hallgatnak. Legalább 16 tesztalanynak (hallgatónak) részt kell vennie az értékelésben. Hallgatás közben a felhasználók 1-5 MOS skálán értékelik a hívást. A felhasználói értékelések átlagértékei képezik az Általános hívásminőség generálását.
egy DCR tesztben két beszédminta van jelen. Az első beszédminta egy előre meghatározott minőségű referenciaminta. A minta itt néhány másodpercig tartó beszédre utal. A másik beszédminta egy degradált változat. A hallgatóknak össze kell hasonlítaniuk a degradált változatot egy 1-től 5-ig terjedő degradációs skálán szereplő referenciával. Itt az 5 nem hallható lebomlás, az 1 pedig a legrosszabb lebomlás. Az eredményeket degradált MOS-ként foglaljuk össze.
a CCR tesztekben a felhasználókat arra kérik, hogy hallgassanak meg két mintakészletet, az egyik a referenciának, a másik a degradáltnak felel meg. Ez a teszt hasonló a DCR-hez, azzal a különbséggel, hogy a hallgatóknak bemutatott minták sorrendje különböző iterációkban változik. A referencia sorrendet és a degradáltat nem jelentik be a hallgatónak. A hallgatókat arra kérjük, hogy összehasonlító értékelést adjanak egy második mintáról az elsőhöz képest -3-tól 3-ig terjedő skálán, a P. 800 D. melléklet szerint . Az eredmények bemutatásakor a” 3 “sokkal jobb minőséget, a” -3 ” pedig a legrosszabb minőséget képviseli relatív skálán. A minőségi pontszám mos-ra van leképezve. A megengedett MOS besorolás 1-5, de a 4,5 feletti felhasználói értékelés 4,5-re korlátozódik.
szubjektív tesztek vesznek részt az eljárásokban, és ez költséges erőfeszítés. Kevesebb iterációra korlátozódik az új algoritmusok vagy beszédkódok értékelése. Nehéz fenntartani a következetességet, mint az eszközalapú objektív tesztek.
20.1.2

objektív mérési technikák

objektív módszerek a mérések és számítások. Várható, hogy az eredmények több mérés során következetesek lesznek. Számos objektív módszer létezik, és aktív és passzív módszerként vannak besorolva.
• a PESQ aktív megfigyelési technikái
* a P. 563 passzív megfigyelési technikái és az E-modell
aktív megfigyelési technikái. Az aktív mérést tolakodó monitorozásnak vagy offline monitorozásnak nevezzük külső jelek bevonása miatt.
a szubjektív hallgatási minőség kiegészítése érdekében alacsonyabb költségű objektív módszerekkel tesztelnek. A KPN kifejlesztette a P. 861 (ez már elavult) perceptual speech quality measure (PSQM) a kodek teljesítményének értékelésére. A British Telecom kifejlesztette a perceptual analysis measurement system (PAMS) rendszert a hálózati mérésekhez. A P. 862 PESQ egy ITU verseny eredménye. A PAMS és a PSQM új verziója, a PSQM99 teljesítménye hasonló volt, így a közreműködőket felkérték az algoritmusok kombinálására. Ez PESQ-t eredményezett, ami valamivel jobb, mint alkotóelemei.
ezek a módszerek egy átviteli rendszer és kodek által bevezetett torzítást mérnek, összehasonlítva egy telefonos interfészen a rendszerbe küldött eredeti referenciafájlt egy másik telefonos interfészen vett károsodott jellel. A PSQM-et a beszéd kodekek laboratóriumi tesztelésére fejlesztették ki. A PAMS és a PESQ hálózati tesztelésre készült. A hangminőséghez használt eszközök használata sokkal egyszerűbb a szubjektív vagy passzív mérésekhez képest. A műszerek beszállítói az extra-származtatott paramétereket is biztosítják, amelyek segítenek a lebomlás forrásainak mérésekkel történő azonosításában. A különféle funkciókkal kapcsolatos további részletekért olvassa el a 13. témakörben megadott néhány eszközt.
a téma írása közben a pesq népszerű támogatást kapott az eszközökben. A PESQ-t az ITU 2001 márciusában hagyta jóvá P. 862 ajánlás, p helyett.861 perc. A PESQ egyesítette a PAMS és a PSQM számos legjobb érdemét. Pontos a szubjektív teszteredmények előrejelzésében, és robusztus olyan súlyos hálózati körülmények között, mint a változó késleltetés, szűrés Analóg interfészeken, valamint mind a széles sávú, mind a keskeny sávú támogatás. A PESQ olyan pontszámot produkál, amely -0,5-4,5 skálán fekszik. A P. 862 PESQ pontszámtól az átlagos szubjektív P. 800-LQ MOS pontszámig leképezési funkciót biztosítottak, így
PESQ – LQO keskeny sávú hanghoz. Az LQO a hallgatási minőség célját jelöli. A PESQ-LQ 1-től 4,5-ig fekszik. Egy MOS 4.Az 5 az egyértelmű torzítás nélküli állapothoz elért maximális minőség. A PESQ algoritmus áttekintése itt található. Javasoljuk, hogy olvassa el az ITU P. 862 ajánláscsaládot, szoftvert és néhány kereskedelmi eszköz brosúrát további részletekért .
20.1.3

Pesq mérés

az emberi hallásérzékelés a pesq és elődei, a PAMS és a PSQM mögött álló alapkoncepció. Az észlelési modellt használják a hallható és a nem hallható torzulások helyes megkülönböztetésére, és ez bizonyult a legjobb módszernek a komplex torzulások hallhatóságának és bosszantásának pontos előrejelzésére. A torzítás mennyisége mellett a hallható torzítás eloszlása sokkal pontosabbá teheti a minőségi előrejelzéseket.
a PESQ egyirányú hangminőséget mér, ami a mérés fél-duplex működését jelenti. A hálózaton keresztül kódolt és továbbított torz beszédjel minőségét az eredeti torzulásmentes jelhez viszonyítva értékeli. Az eredeti és torz beszéd olyan pszichofizikai ábrázolásokhoz van hozzárendelve, amelyek megegyeznek azzal, ahogyan az emberek megtapasztalják a beszédet.
a torzított beszéd minőségét a pszichofizikai ábrázolások különbségei alapján ítélik meg. A pesq művelet a logaritmikus műveletek két fő osztályát használja-nevezetesen a jelek pszicho-akusztikus tartományba történő átalakítását és a kognitív modellezést. A pesq algoritmus funkcionális ábrázolása az ábrán látható. 20.2. A pesq méréshez használt műszergyártók a pesq méréseken kívül számos további műveletet is tartalmaznak a jelelemzési paraméterek és károsodások kinyerésére.
 pesq algoritmus funkcionális ábrázolások.
20.2.ábra. Pesq algoritmus funkcionális ábrázolások.
a pesq algoritmus által végzett feldolgozás az alább felsorolt szakaszokat tartalmazza. Az összefoglaló lépéseket itt adjuk meg; a PESQ több részletét itt adjuk meg .
a feldolgozás első lépésében mind a referencia, mind a leromlott jelet ugyanarra az állandó teljesítményszintre méretezzük. Erre a skálázásra azért van szükség, mert a referenciajelnek nem kell meghatározott szinten lennie, és a vizsgált rendszer nyeresége a tesztelés előtt nem ismert. A pesq feltételezi, hogy a szubjektív hallgatási szint állandó 79 dBSPL a fül referenciapontján . A teljesítmény normalizálásához az elektromos jelszinteket-26dbov-ra normalizálják (azaz-20dBm a referenciában megadott módon ). Jelszint-normalizálást alkalmaznak mind a referenciára, mind a leromlott jelre, hogy ezeket erre a szintre hozzák.
az olyan észlelési modelleknek, mint a PESQ, figyelembe kell venniük a telefonkészülékek jellemzőit, mivel a szubjektív hallgatás telefonkészülékeket használhat. Ban ben PESQ, a kézibeszélők vételi útvonalát egy közbenső referenciarendszer (IRS) sáváteresztő szűrő a frekvenciatartományban. Ez a folyamat figyelembe veszi a kézibeszélő elektromos és akusztikus alkatrészeinek hatásait. Mind a referencia, mind a leromlott jel IRS szűrt.
a vizsgált rendszer tartalmazhat változó késleltetést. A referencia és a degradált jelek összehasonlításához mindkét jel időben igazodik egymáshoz. A pesq összehangolja a beszédkeretek átfedő szakaszait. Az első szakaszban a késleltetés becslését a fájlok hosszában hajtják végre a fájlok közötti korreláció kiszámításával. Az ebben a szakaszban kapott késleltetést nyers késésnek nevezzük. A következő szakaszban a PESQ hangaktivitás-észlelést alkalmaz a jelekre, hogy azonosítsa a szükséges beszédszegmenseket, amelyeket általában kimondásnak neveznek. A kijelentések közötti késleltetési becslés a finom késés. Ez a folyamat olyan késleltetést észlel, amely változó a kijelentés hosszában, mivel ez csomagalapú hálózatokban jelentős lehet.
az időhöz igazított referencia és a degradált jelek frekvenciatartományba alakulnak át egy rövid távú gyors Fourier-transzformáció (FFT) alkalmazásával, amelynek Hanning ablaka 32 ms-os kereteken keresztül, 50% – os átfedéssel. Az eredeti és a degradált jelek erejét külön számítják ki és tárolják. A műveletek következő szakaszában a frekvenciasávokat kéreg skálává alakítják át az FFT sávok binningjével. Ez a folyamat a Hz-ben megadott frekvenciask-t a hangmagasság-skálára vetemedik, és a kapott jeleket hangmagasság-sűrűségnek nevezzük. Ebben a folyamatban nagyobb sávszélességet használnak a frekvenciaelemzés útján levezetett nagyfrekvenciás jelhez.
a vizsgált rendszerben a szűrési hatásokat úgy egyenlítik ki, hogy minden kéregtartón egy részleges kompenzációs tényezőt számolnak ki, és a referenciajel minden egyes képkockáját megszorozzák ezzel a tényezővel. Ez a folyamat kiegyenlíti a leromlott jelre való hivatkozást. A kompenzációs tényezőt a leromlott jelspektrum és a referenciajel-spektrum arányaként számítják ki. Ez a tényező figyelembe veszi a hálózat analóg komponenseinek, például a telefonkészülékeknek a szűrését. A kiegyenlítés második szakaszában a rendszer képkockánkénti amplitúdója
nyereségét becsüljük meg és használjuk a leromlott jel referenciajellel való kiegyenlítésére. Mindkét esetben a kiegyenlítés részleges, és a nagy mennyiségű szűrés vagy erősítésváltozás nem törlődik; ezért hibákat mér. A frekvenciát és az erősítéssel kiegyenlített hangmagasság – sűrűséget zwicker törvényével hangossági skálává alakítják át . A kapott idő-frekvencia komponenseket hangossági sűrűségnek nevezzük.
a referencia és a degradált jelek hangsűrűsége közötti szignált különbséget nyers zavarsűrűségnek nevezzük, amely a vizsgált rendszer által bevezetett hallható különbségeket mutatja. A maszkolási művelet maszktényezőt alkalmaz a nyers zavarsűrűségekre, amely elfedi a kis, nem hallható torzulásokat hangos jelek jelenlétében. Az ezzel a folyamattal kapott zavarsűrűséget abszolút vagy szimmetrikus zavarsűrűségnek nevezzük. A szimmetrikus zavarok a keret hosszában vannak integrálva (kereten belüli). A küszöbérték feletti keretzavarral rendelkező egymást követő képkockákat rossz képkockák kategóriájába soroljuk. A rossz keretek hibás késleltetési becslés vagy csomagcseppek miatt fordulhatnak elő. A rossz keretek körüli lokalizált ablakban egy új késleltetési becslés készül, amelyet a zavarsűrűségek újraszámítására használnak. Az előző és az aktuális zavarok minimumát a rossz keretablak végső zavarának tekintjük.
a hálózatban használt kodek által bevezetett torzítás modellezéséhez aszimmetrikus zavarsűrűséget kell kiszámítani úgy, hogy a szimmetrikus zavarsűrűséget aszimmetriatényezővel megszorozzuk. Az aszimmetriatényező a torz és az eredeti hangmagasság-sűrűség aránya, amelyet 1,2-re emelnek. Ezt a zavarsűrűséget additív vagy aszimmetrikus zavarnak nevezzük.
végül a hibaparamétereket minőségi pontszámra konvertáljuk, amely az átlagos szimmetrikus zavarérték és az átlagos aszimmetrikus zavarérték lineáris kombinációja. Tól Ábra. 20.2, a szintbeállítástól a hangossági skála intenzitás-vetemedéséig terjedő szakaszokat a pszicho-akusztikus tartományra való átalakításnak, az algoritmikus szakaszokat pedig az észlelési kivonástól a PESQ pontszámszámításig kognitív modellezésnek nevezzük.
a PESQ a P. 862 szerint PESQ pontszámként ismert pontszámot ad. A PESQ pontszám -0,5-4,5 tartományban van. A pesq korrelál a szubjektív MOS-val, mint 0,94 az adatbázisokon végzett kísérletek alapján . A szubjektív (tényleges hallgatók) pontszámokkal összehasonlítva a pesq jobb eredményeket ad a rossz minőségű beszédért, a pesszimista eredményeket pedig a jó minőségű hangért. A PESQ-LQ jobb korrelációt biztosít a szubjektív pontszámokkal, mint a pesq a hallgatási minőségi skálán. A PESQ-LQ pontszámok 1-4, 5 tartományban vannak. A P862.1 minőségi leképezést biztosít a keskeny sávú minőségi mérések PESQ pontszáma és a hallgatási minőség objektív átlagos vélemény pontszáma (mos-LQO) között. A P. 862. 2 ajánlás minőségi leképezést biztosít a szélessávú minőségi mérések PESQ pontszáma és a hallgatási minőség objektív átlagos vélemény pontszáma között. Ezekről a pontszámokról további információk találhatók az ITU – T-P. 862 sorozat ajánlásaiban és hivatkozásaiban .
a PESQ egy félduplex művelet, amely nem fogja pontosan rögzíteni a végpontok közötti késleltetést, visszhangot, hangosságvesztést, oldalhangot és hallgatási szintet. A VoIP átjáró analóg interfészekkel történő hangminőség-méréséből a következő PESQ-LQO megfigyeléseket végezzük DSLA segítségével . Csomagvesztés nélküli feltétel esetén a G. 711 kodek PESQ-LQO pontszáma 4,32, a G. 729A 3,85, a G. 723.1 pedig 3,75. Ezeknek az eredményeknek egy másik értelmezése a csomagleadási helyzetekre és az e-modellel való összehasonlítás az R-faktor számítások részeként található, és a 20.4.táblázat mutatja be. A pesq számítások során számos más paraméter kiszámítható. A műszer-beszállítók ezeket a paramétereket a PESQ mérések további jellemzőiként biztosítják .
20.1.4

passzív megfigyelési technika

i n passzív megfigyelési technikák, a referenciajel nincs jelen. Két népszerű módszer létezik a passzív beszédminőség ellenőrzésére. Az ITU szabványosította a P. 563 jel alapú, nem tolakodó megfigyelési módszert, amely három vállalat, a Psytechnics Ltd.együttműködésének eredménye alapján készült., Swissqual, Opticom, amely három különböző modell legjobb paramétereit kombinálta. A P. 563 egy egyvégű objektív mérés, amely beszédtermelési mechanizmust használ, a többi beszédmodell pedig a hallgatás észlelését használja. Ez az algoritmus csak a kapott degradált beszéden működik. Nem lesz szüksége referencia beszédre, és teljes mértékben a degradált beszéden működik. A mérések p-n keresztül.563 számos paramétert vezet le a kapott beszédből, amelyeket zajnak, mesterséges beszédnek és tényleges beszédnek minősítenek. A P. 563 egyvégű beszédminőség-értékelési művelet áttekintése itt található.
referenciajel hiányában a modellek nem ismerik az eredeti jelet, ezért feltételezéseket kell tenni a vett jelről. A P. 563 modell három alapelvet ötvöz a torzulások értékelésére. Az első elv az emberi hangtermelő rendszerre összpontosít, a vokális traktust csövek sorozataként modellezve, a csövek szakaszainak rendellenes variációival, amelyeket lebomlásnak tekintenek. A második alapelv a leromlott jelből egy tiszta referenciajel rekonstruálása annak érdekében, hogy ezt követően teljes referenciájú észlelési modellt alkalmazzanak, és a rekonstrukció során leplezetlen torzulásokat értékeljenek. A harmadik alapelv a hangcsatornákban előforduló sajátos torzulások azonosítása és becslése, mint például az időbeli vágás, a robotizáció és a zaj. A hallgatási beszéd minősége a három alapelv számított paramétereiből származik, torzításfüggő súlyozást alkalmazva.
a téma írása közben a P. 563-alapú technikát nem fogadták el széles körben a mérésekhez. A P. 862 PESQ alapú mérések és az E-modell alapú becslések népszerűbbek. Ennek a P. 563 technikának a fő előnye, hogy képes nyomon követni a leromlott végén anélkül, hogy hivatkozást kérne. Így jobban figyelemmel tudja kísérni a távolsági hívásokat a laboratóriumon kívül és a telepítések során, ami sokkal egyszerűbb lesz, mint sok más mérés. A P. 563-alapú módszer beágyazható a fogadó átjáró
részeként is, hasonlóan az e-modelhez és az RTCP-XR-hez. P. 563 műveleteket lehet használni a mintákat, hogy kap szállított a pulse code modulation (PCM) hang interfészek.
További információ a P. 563 technikáról a P. 563 és . A P által készített MOS pontszám.Az 563 és más technikák széles körben elterjedtek, és szükségesek a több teszt eredményeinek átlagolásához, hogy stabil minőségi mutatót érjenek el több eredmény felett. A P. 563 korrelál a szubjektív MOS-szal, mint 0,85 – 0,9 az adatbázison végzett kísérletek alapján, a PESQ pedig 0,94.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.