Fonografie Techniek

VERGELIJKENDE LUIDSPREKERTEST

POGING TOT OBJECTIEVE VERGELIJKING VAN LUIDSPREKERS I

 

Luisprekers vergelijken is een hachelijke zaak. Bij de gebruikelijke methodes wordt met wisselend succes geprobeerd het subjectieve element uit te schakelen. Het gebruik van een referentieluidspreker van zeer goede kwaliteit, de beoordeling van luidsprekers op een 7-punts schaal, het ‘afval’-systeem zijn daarvan voorbeelden.

Toch kleeft aan deze en andere methodes het bezwaar dat de beoordelaar wordt gedwongen (al dan niet verbaal) een oordeel te formuleren. Dit betekent dat hij voor zichzelf criteria moet opstellen en de bewuste luidspreker daaraan moet toetsen. Er is echter een methode die een dergelijke expliciete oordeelsvorming vermijdt en die daardoor lijkt een hogere mate van objectiviteit te kunnen bieden.

 

We kunnen het probleem als volgt in algemene termen beschrijven: het beoordelen van N luidsprekers is in feite het toetsen van N stimuli aan naar aantal en aard onbekende criteria. Dit probleem heeft in de psychofysica de naam ‘multidimensional scaling’ gekregen. In 1964 heeft J. Kruskal een elegante methode voor de oplossing daarvan beschreven. Voor een goed begrip van het volgende is het noodzakelijk een korte uiteenzetting van deze methode te geven.

 

Multidimensional scaling

Stel dat een stimulus (bijvoorbeeld een auditieve of visuele prikkel) door een proefpersoon volgens drie criteria wordt beoordeeld. Het is dan mogelijk hem als aan punt in een driedimensionale ruimte weer te geven, waarbij de coördinaten overeenkomen met de waarderingen volgens elk van de drie criteria. Zijn er meer stimuli, dan ontstaat een verzameling punten, een puntenwolk, in de driedimensionale ruimte.

Nu ligt het voor de hand te veronderstellen dat als twee punten in deze wolk echt dicht bij elkaar liggen, de corresponderende stimuli als zeer gelijk zullen worden beoordeeld. En omgekeerd: grote afstand komt overeen met grote ongelijkheid. Deze relatie tussen afstand en ongelijkheid vormt de basis voor Kruskals methode omdat zoals gezegd de aard en het aantal aan de criteria vaak niet bekend zijn (en dus ook de afstand niet), maar over de mate van gelijkheid vaak meer te zeggen valt.

Veronderstellen we dat het mogelijk is om voor elk paar stimuli (luidsprekersignalen) een gelijkheidsindex te vinden, een getal dus dat een indicatie, geen maat, is voor de gelijkheid, dan is het ook mogelijk een lijst te maken van alle paren, te beginnen met het meest gelijke en eindigend met het meest ongelijke paar. De gelijkheidsindices worden in deze lijst steeds kleiner en vormen dus een monotone reeks.

Deze geordende lijst van paren speelt in Kruskals beschouwing een erg belangrijke rol. Immers, als het daarnaast ook mogelijk is ruimtelijk een puntenwolk te construeren, zodanig dat de afstanden per puntenpaar, geschreven in de gevonden volgorde ook een monotone reeks vormen, dan mogen we de puntenwolk als een afbeelding van de verzameling stimuli beschouwen.

Dit althans in Kruskals hypothese. De auteur geeft in zijn artikel ook een methode aan om de mate van overeenstemming tussen beide reeksen te kwantificeren. Het is namelijk niet altijd mogelijk om een zodanige puntenwolk te vinden dat de overeenstemming tussen de ongelijkheidsreeks en de afstandreeks volledig is. Kruskal laat zien dat het in dit laatste geval mogelijk is de mate van niet-overeenstemming in een getal (een percentage) uit te drukken. Hij noemt dit het ‘stresspercentage’ en 0% stress betekent dan volledige overeenstemming. De eenvoudige interpretatie van de stresspercentages die hij geeft (5%: goed, 10% redelijk, 20% slecht enzovoorts) is niet houdbaar gebleken.

Omdat het aantal criteria onbekend is, is het niet mogelijk a priori te zeggen in hoeveel dimensies men een puntenwolk moet construeren (een ruimte met meer dan drie dimensies is niet voorstelbaar, maar men kan er wel mee werken, omdat ‘afstand’ er op dezelfde manier is gedefinieerd als in de ons bekende ruimte. Intuïtief is het duidelijk dat naarmate er meer dimensies zijn, men meer mogelijkheden heeft voor de constructie van de puntenwolk. Met andere woorden: het stresspercentage zal kleiner zijn.

De methode is nu de volgende: men begint in een ruimte met veel dimensies; bij 9 stimuli bijvoorbeeld in een vier- of vijfdimensionale ruimte. In deze ruimte wordt een willekeurige puntenwolk geconstrueerd. De overeenstemming tussen afstand en (on)gelijkheid is dan natuurlijk erg slecht.

Vervolgens wordt de configuratie stapsgewijs veranderd en wel zodanig dat de stress steeds kleiner wordt. Hiermee gaat men (of beter gezegd de computer, want zonder computer is dit werk onuitvoerbaar) door tot het stresspercentage een minimum heeft bereikt en de overeenstemming tussen afstand en ongelijkheid optimaal is. Dan probeert men hetzelfde in een ruimte met één dimensie minder.

Het minimum stresspercentage zal nu hoger komen te liggen, maar kan nog acceptabel zijn. De oplossing met het kleinste aantal dimensies en een nog aanvaardbaar stresspercentage (het vaststellen van wat nog aanvaardbaar is, vormt een probleem op zichzelf) wordt als de puntenwolkvoorstelling van de stimuli beschouwd. Men weet nu dus het aantal criteria dat is gebruikt (= het aantal dimensies) en men weet hoe de puntenwolk er uitziet. De identificatie van de dimensies met bekende criteria is dan natuurlijk vers twee.

 

De triadische vergelijking

Wil men deze methode ook op luidsprekers toepassen, dan is het eerste probleem hoe een gelijkheidsindex voor de luidsprekerparen kan worden gevonden. Een veel gebruikte methode die ook door ons is toegepast, is die der triadische vergelijking: men laat de proefpersoon naar drie luidsprekers luisteren. Hij kan naar believen (maar natuurlijk niet gelijktijdig) elke luidspreker inschakelen. Zijn opdracht is twee punten toe te kennen aan het naar zijn mening meest gelijke paar, nul punten aan het meest ongelijke en één punt aan het resterende paar.

Dit moet hij/zij doen voor alle drietallen (triades) die uit de gegeven verzameling stimuli kan worden gevormd. Deze methode beperkt het aantal stimuli vrij rigoureus omdat het aantal mogelijke triades snel stijgt met het aantal stimuli; het is namelijk gelijk aan n!/ (3!. (n-3)!). Voor negen stimuli is dit 84, voor tien is het 120 enzovoorts. We hebben ons daarom ook beperkt tot negen luidsprekers.

Daarnaast is nog een variant op deze methode toegepast die het mogelijk maakte om een groep testpersonen gelijktijdig te laten scoren en zo tot betrouwbaarder resultaten te komen. Hierbij was het nodig de volgorde waarin de luidsprekers worden ingeschakeld duidelijk vast te leggen. Dat gebeurde door de volgende reeksen te gebruiken:

ABAC (2x); uitspraak over het paar AB vergeleken met het paar AC, BABC (2x); hetzelfde voor de paren BA en BC en tenslotte CA CB (2x) voor de paren CA en CB. Uit deze gegevens kan de gevraagde uitspraak over de triade ABC worden afgeleid en tevens kunnen gevallen aan het licht komen waarin elk paar (dus AB, BC en AC) een keer als meest gelijkend naar voren komen. Dit is een ’fout’ die echter gemakkelijk kan optreden wanneer de ‘afstanden’ tussen de drie luidsprekers ongeveer gelijk zijn.

 

De luidsprekers die voor deze test werden gebruikt zijn:

1 Scott S-10 – ƒ425,-2 Leak Sandwich 300 – ƒ425,-3 Wharfedale Melton – ƒ415,-4 Acoustic Research AR 6 – ƒ465,-5 Philips  RH (497) 427 – ƒ434,-6 Dual CL 170 – ƒ351,-7 B & O Beovox 3700 – ƒ428,-8 Celestion Ditton 15 – ƒ399,-9 Scan Dyna A 30X – ƒ422,- 

De mono opstelling van de luidsprekers was in wandvorm in de collegezaal van het Instituut voor Sonologie van de Utrechtse universiteit waar het gehele onderzoek, inclusief de berekeningen op de aldaar aanwezige computer plaatsvond. Tevoren waren de luidsprekers met behulp van roze ruis en een B & K sound level meter op gelijk niveau op 82dB lijnniveau ingeregeld om rendements- en impedantieverschillen te compenseren.

Voor elk van de drie groepsexperimenten (met respectievelijk 12, 9 en 10 proefpersonen) zijn drie muziekfragmenten gebruikt en wel uit:

1)      Bartók: Muziek voor snaren, slagwerk en celesta, uitgevoerd door The Academy of St.Martin-in-the-Fields o.l.v. Neville Marriner. Argo ZRG 657.

2)      Schönberg: Pierrot lunaire, uitgevoerd door Helga Pilarczyk met het Orchestre du domaine musical o.l.v. Pierre Boulez. Wergo WER 60001.

3)      Mozart: Divertimento KV 136 door The Academy of St.Martin-in-the-Fields o.l.v. Neville Marriner. Argo ZRG 554.

Voor de individuele proeven is een groot aantal verschillende muziekfragmenten gebruikt en is tevens gebruik gemaakt van synthetische signalen zoals roze ruis en tonebursts. Het totaal aantal proefpersonen bedroeg hier 18.

De muziekfragmenten waren tussen vijf en tien seconden lang en konden willekeurig vaak worden herhaald omdat ze ten gehore werden gebracht via bandlussen. Deze lussen (die in verband met slijtage regelmatig werden vernieuwd), werden afgespeeld op professionele Philips recorders (PRO 51 en EL 3566) en op de Revox G 36. Als eindversterkers werden Philipsversterkers van het type AG 9007 (45/60W buizenversterker zonder uitgangstransformator) gebruikt; voor een juiste aanpassing aan elke luidspreker werden Unitran transformatoren van het type 25 L 10 gebruikt. Voor het automatisch doorschakelen bij de groepsexperimenten werd een telefoonkiezer gebruikt die werd gestuurd door fluittoontjes die op spoor 2 van elke bandlus vóór het begin van het muziekfragment waren opgenomen.

 

Resultaten

De door iedere proefpersoon opgestelde gelijkheidsmatrix, waarin voor ieder luidsprekerpaar de gelijkheidsindex is vermeld, is uitgewerkt. Het is natuurlijk ondoenlijk al deze resultaten hier weer te geven. We zullen ons dus tot enkele gevallen beperken. Als we eerst de groepsexperimenten nemen, is het mogelijk de per triade en per proefpersoon uitgevoerde puntentoekenning na te gaan en vervolgens de meest gekozen toekenning als de toekenning over te nemen.

Op deze manier hebben we de resultaten van de drie groepen per proefpersonen gecombineerd, nadat op grond van betrouwbaarheidscriteria twee proefpersonen waren afgevallen. De gelijkheidmatrix ziet er dan als volgt uit:

 Gelijkheidsmatrix

Luidspreker

            1

2          6          2

3          13        9          3

4          10        10        7          4

5          3          8          0          4          5

6          6          12        5          14        6          6

7          5          10        4          4          4          8          7

8          10        10        4          13        1          7          4          8

9          8          7          8          8          4          7          11        2

 

Hieruit blijkt nu dat het paar 6, 4 de hoogste gelijkheidsindex heeft en het paar 5, 3 de laagste. De stresspercentages in 4, 3, 2 en 1 dimensie waren:

 

            4 dimensies: 0,454%

            3       ,,         : 2,583%

            2       ,,         : 6,018%

            1 dimensie  : 23,135%

 

Op grond van een door Wagenaar uitgevoerd onderzoek blijkt de tweedimensionale oplossing de meest zinvolle te zijn. Dit is een belangrijk resultaat; het betekent immers dat voor de vergelijking van de luidsprekers door de proefpersonen twee criteria zijn gehanteerd.

De door de computer berekende tweedimensionale configuratie is hierboven in de gelijkheidsmatrix weergegeven, de afstanden tussen de punten (uitgedrukt in een willekeurige eenheid) ziet er als volgt uit in de

 

Afstandsmatrix

Luidspreker

            1

2          5,95     2

3          2,42     7,46     3

4          4,28     3,38     6,54     4

5          12,72   6,78     14,16   9,35     5

6          6,62     1,64     8,48     3,00     6,37     6

7          8,60     5,39     8,60     8,35     8,33     6,91     7

8          6,05     7,03     8,43     3,74     12,02   6,17     12,09   8

9          6,89     5,74     6,37     7,88     10,39   7,38     2,56     11,44

 

Bij vergelijking van gelijkheids- en afstandmatrix blijkt al direct dat de overeenstemming niet volledig is; de kleinste afstand vinden we bij paar 6, 2 in plaats van bij paar 6, 4. Maar zulke afwijkingen zijn op grond van de 5% stress te verwachten. Men kan ter controle beide reeksen uitschrijven en de overeenstemming nagaan. Dat is gebeurd in een (hier niet afgebeeld) kwadrantensysteem. Daarin is te zien hoe de onderlinge relaties tussen de luidsprekers liggen met nr. 1 iets onder de horizontale as op 1/5 van de horizontaal, nr. 2 iets boven de horizontaal vlakbij het kruispunt in het vierde kwadrant, nr. 3 op ongeveer de helft en iets boven de horizontale as in het eerste kwadrant, nr. 4 op ongeveer 1/3 en vlakbij de verticale as in het derde kwadrant, nr. 5 extreem ver van het kruispunt der assen in het vierde kwadrant, nr. 6 tussen nr. 2 en 4 in binnen het derde kwadrant, nr. 7 vrijwel op de verticale 4/5 boven het kruispunt in het vierde kwadrant, nr. 8 vrijwel op de ondergrens van de vertikaal in het derde kwadrant en nr. 9 iets naar links middenin het eerste kwadrant.

Vooral nr. 5 danst nogal uit de rij, maar kenmerkte zich dan ook door een tamelijk onaangenaam scherp timbre. De interpretatie van deze bevindingen is verder niet zo eenvoudig.

In een aparte test is getracht om een kwaliteitsreeks van de negen luidsprekers op te stellen. Ook dat was niet eenvoudig en leverde verschillende resultaten op, afhankelijk van de gebruikte muziek. Wel was duidelijk dat de algemene tendens was: een kopgroep met 1, 3, 4 en 8, een middengroep met 2, 6, 7 en 9 en tenslotte 5 als hekkensluiter. Deze volgorde vindt men terug wanneer de punten op de gestippelde horizontale as worden geprojecteerd. De bewuste lijn zou dus als kwaliteitslijn kunnen worden beschouwd, hetgeen zou betekenen dat ‘kwaliteit’ door de proefpersonen als onafhankelijk attribuut is beschouwd.

De loodrecht op de gestippelde as te tekenen tweede as heeft mogelijk te maken met de balans tussen hoog- en laagweergave, maar dat is thema van nader onderzoek. Hoewel deze test niet was opgezet als kwaliteitstest, lijkt het er dus op dat de ‘kwaliteit’ toch via een achterdeur weer is binnengekomen.

De projectie van de negen clusters (en met name van de ‘zwaartepunten’) leidt tot de volgende reeks: (8-1-3-4) – (6-2-9-7) – 5, welke reeks ook is gevonden na een nogal moeizaam verlopen met veel discussie gepaard gaand experiment voor het vaststellen van de kwaliteitsvolgorde. Daarbij was de volgorde binnen de haken niet steeds hetzelfde, hetgeen niet verwonderlijn is wanneer men let op op de projectie van de clustercontouren op die as.

Vooral voor de eerste groep overlappen deze elkaar voor een groot deel. Maar met de door ons gebruikte methode komt de kwaliteitsvolgorde er als het ware automatisch uit en bovendien is het mogelijk om binnen de groep van negen luidsprekers een kwantitatieve maat voor de kwaliteit aan te geven. Dit is een belangrijk resultaat omdat dit met de gebruikelijke tests onmogelijk is, terwijl het toch van belang is om te weten hoe groot het kwaliteitsverschil is, of dat er tussen bepaalde luidsprekers uit een kwaliteitsreeks geen significant verschil bestaat, zoals in ons geval tussen de nummers 1, 3, 4 en 8.

 

Invloed muziek en tonebursts

Uit de resultaten blijkt verder dat de keuze van het muziekfragment niet tot duidelijk verschillende configuraties leidt na de drie groepsexperimenten. Alleen luidspreker 7 in experiment 2 is op een andere plaats op de bijna horizontaal verlopende A as beland. Dat zou kunnen duiden op een naar verhouding betere weergave van Schönbergs Sprechgesang (van de menselijke stem in het algemeen?) dan van de zuiver orkestrale fragmenten.

Dezelfde conclusie met betrekking tot de rol van het gebruikte muziekmateriaal kan worden getrokken uit de configuratie voor één van de proefpersonen toen gebruik werd gemaakt van een fragment uit Beethovens pianosonate nr. 21 Waldstein door Daniël Barenboim op H.M.V. 1C 053-01884. Op een enkele uitzondering na vallen ook hier alle punten binnen de clustercontouren.

Hetzelfde kan worden gezegd van tests met synthetisch klankmateriaal: roze ruis levert een ééndimensionale configuratie op waarin met moeite iets van de kwaliteitsreeks te herkennen valt.

Over de resultaten met tonebursts valt weinig zinnigs te zeggen; ze leveren tweedimensionale structuren op die echter sterk afwijken van de gangbare types. Dat alles schenkt weinig vertrouwen in tests die louter met dit soort klankmateriaal worden uitgevoerd.

Toch is het aan de toneburst test te danken dat er een plausibele interpretatie is voor de projectie op de loodrecht op de A as verlopende B as. De Kruskal analyse van een dergelijke test, waarbij met zeer lage frequenties (100Hz) werd gewerkt, leverde de volgende stresspercentages op:

            4 dimensies: 0,002%

            3       ,,         : 2,021%

            2       ,,         : 5,160%

            1 dimensie  : 10,548%

 

Basweergave

Deze getallen wijzen duidelijk op een ééndimensionale structuur die in dit geval uiteraard betrekking moet hebben op de laagweergave van de betreffende luidsprekers. Deze configuratie blijkt, zeker wat de volgorde betreft, overeen te komen met de projecties van de clusters op de B as.

De tamelijk geprononceerde basweergave van met name de Wharfedale luidspreker was verschillende proefpersonen overigens al eerder opgevallen. Hoe de relatie tussen kwaliteit en basweergave is (beide factoren doen zich hier onafhankelijk van elkaar voor), vergt nader onderzoek. Maar de hier gegeven verklaring laat zich ook op andere dan de genoemde gronden heel goed verdedigen.

 

Conclusie

Samenvattend kan worden gezegd das Kruskals methode voor ‘multidimensional scaling’ toegepast op de resultaten van triadische vergelijking van luidsprekersignalen leidt tot een tweedimensionale configuratie waarbij de ene as de basweergave en de andere as de kwaliteit als onafhankelijke eigenschap weergeeft. Daarmee is deze methode goed bruikbaar voor de kwaliteitsbepaling van luidsprekers.

 

Literatuur

Kruskal, J.B. (1964): Multidimensional scaling by optimizing goodness of fit to a nonmetric hypothesis. (Psychometrika 34, 1).Wagenaar, W.A. en Padmos, P (1971): Quantitative interpretation of stress in Kruskal’s Multidimensional scaling technique. (Br. J. math. Statist. Psychol. 24, 101). (Uit Disk 1972, 12).