Die Güteprüfung des Persönlichkeits-Screenings Per-Screen

Matthias Scharlach Forschung & Psychologie Leave a Comment

Warum noch ein Persönlichkeitsscreening?

Ende der neunziger Jahre sahen wir uns im Prozess der Ausarbeitung unternehmensspezifischer Assessments zunehmend mit einer Problemlage konfrontiert, die vielschichtig ist und aus der hier nur auf zwei Erkenntnisse fokussiert werden soll:

Erstens: Die Anforderungen der Arbeitsprozesse an den tätigen Menschen werden über seine Fachkompetenzen in immanenter Wechselwirkung mit seinen Persönlichkeitskompetenzen umgesetzt.(1) Die wechselseitige Abhängigkeit dieser beiden Kompetenzarten gewinnt an Bedeutung für die Qualität der Arbeit und das Verhalten in Arbeitsprozessen. Dabei ist es für die Unternehmen relativ einfach, präzise Aussagen zu Fachkompetenzen zu treffen, weitaus schwieriger scheint es jedoch, geeignete Kompetenzen für das Verhalten in verschiedenen Arbeitswelten zu fixieren. Die Suche nach geeigneten Fachkräften scheitert aber nicht selten genau an diesem Phänomen.
Da es nicht leicht ist, die wirklich benötigten Persönlichkeitseigenschaften in der für den spezifischen Arbeitsprozess sinnvollen Ausprägung zu beschreiben – also das Optimale zu fixieren-, flüchtet man in das Maximale und beschreibt eine „Eier-legende Wollmilch sau“, die man natürlich nicht findet. Erscheinungsformen sind dann unbesetzte Stellen, überhöhte Erwartungen und frühzeitiger Arbeitsstellenwechsel. Wir haben festgestellt, dass diesem Fehler auch langjährig tätige Personalabteilungen von nicht kleinen Organisationseinheiten unterliegen können.

Zweitens: Personalentscheider sind zum überwiegenden Teil keine ausgebildeten Psychologen. Das müssen sie auch nicht. Ungeachtet dessen, werden aber wissenschaftlich ausgearbeitete Instrumente zur Feststellung des Vorhandenseins einzelner Eigenschaften und Verhaltensweisen auf verschiedenen Abstraktionsebenen genutzt über deren Verwendungsrahmen und Aussagekraft man sich nicht immer bewusst zu sein scheint. Es besteht einerseits die Gefahr einer unbewussten „Horoskopisierung“ und andererseits der mechanistischen „Input-Output-Sicht“ bei der Handhabung von Tests und anderen Informationserfassungsverfahren. Auch ist die Zeit, die man benötigt, um an die für die Entscheidungsfindung notwendigen Informationen zu kommen unter kommerziellem Aspekt oft zu lang, so dass letztlich eine „Computerentscheidung mit symbolischen Kurzgespräch“ vor einer wirklich aus einem vorbereiteten persönlichen Gesprächs resultierenden Entscheidung Vorzug gegeben wird.

Diese Tatbestände bewogen uns, über ein auch für Nichtpsychologen leicht handhabbares Verfahren mit hohem Informationsgehalt nachzudenken, ohne die Prinzipien der Wissenschaftlichkeit zu verletzen.

Der Aufbau des Screenings und sein Geltungsbereich

Dem Screening liegen 112 Indikatoren zugrunde, die die Ausprägung von 22 Persönlichkeitseigenschaften indizieren sollen. Es wird ergänzt durch 4 Distractionsitems sowie 11 Indikatoren, die allgemeine Zusatzinformationen erfassen.
Die Indikatorenreihung wurde über Zufallsgeneratoren ermittelt, um inhaltliche Interferenzen zu minimieren.
Die Rohpunktwerterfassung erfolgt über eine 4-stufige ordinalskalierte Intensitätsskala.
Das Screening verfügt über 19 Falsehood- (Lügen-) Indikatoren, die Rückschlüsse auf relativ konstantes bzw. streuendes Antwortverhalten des Probanden zu gleichen Sachverhalten zulassen. Der Proband wird viermal im Verlauf der Befragung in geeigneter motivierender Ansprache (Texteinblendung) über sein Antwortverhalten informiert.

Das Verfahren führt zu Aussagen in den Bereichen:

  • allgemeines Aktivitätsniveau (Drive)
  • Arbeitseinstellungen
  • Verhalten gegenüber Anforderungen und Situationen
  • soziales Verhalten
  • Verhalten zu sich selbst
  • Temperamentseigenschaften
  • Stressresistenz

Per-Screen[basic] wird am PC durchgeführt. Die Befragung kann aber auch über ein Printmedium erfolgen, wobei dann die Informationen zur digitalen Verarbeitung in ein Antworttableau eingegeben werden müssen.

Die Ergebnisse des Screenings, wie „Allgemeine Auswertung in Textform“, Eigenschaften-Netzdiagramm“ und anderes können im Anschluss an die Befragung vom Nutzer unter optionaler Zuhilfenahme eines Interpretationsleitfadens sofort eingesehen werden.

Indem sich das Screening auf Angaben des Probanden stützt, ist die prinzipielle Fähigkeit des Probanden zur Beurteilung von Dingen und Erscheinungen eine generelle Anforderung.
Das Indikatorverständnis setzt als untere Grenze des intellektuellen Entwicklungsniveaus den Regelschulabschluss und eine gewisse Grunderfahrung in der Lebensweise in modernen Industriegesellschaften voraus. Die Altersgruppe sollte Jugendliche mit einer mittleren Reife unter 18 Jahren nicht unterschreiten.
Die Probanden sollten die deutsche Sprache auf einem Niveau -auch in ihrer Nuancierung-beherrschen, welches es ihnen erlaubt, die in den Indikatoren angesprochenen Sinnzusammenhänge zu erfassen.

Die in der Instruktion enthaltene Aufforderung, die Fragen möglichst spontan zu beantworten, wird tendenziell geschlechtsspezifisch signifikant unterschiedlich wahrgenommen. Dieses Phänomen korreliert mit der Beantwortungszeit. Weibliche Probanden benötigen ca. 30-35 Minuten, männliche mitunter auch 40-60 Minuten.
Das Screening ist als ein (und nicht der) Baustein im Kontext weiterer Informationserfassungsmethoden zur Vorbereitung Persönlicher Gespräche als Instrument zur Strukturierung und inhaltlichen Ausrichtung von Kommunikationsprozessen in den Bereichen Lebenswegberatung, Personalrekrutierung und Mitarbeiterführung konzipiert.

Zur Einordnung des Persönlichkeits-Profil-Screenings Per-Screen[basic] in das Methodenarsenal der Persönlichkeitsforschung

Per-Screen[basic] ist eine spezifische Form der schriftlichen Befragung und neben der Beobachtung, dem Interview, der Exploration, dem Experiment, dem Test sowie der Dokumenten- und Werkanalyse eine von zahlreichen Analysetechniken, die der generellen Erkenntnis unterliegt, dass sich die Qualität gewonnener persönlichkeitsanalytischer Informationen durch seinen abgestimmten Einsatz im Komplex verschiedener Informationserfassungsmethoden über integrative Interpretationen erhöht.

Die Entwicklung des Per-Screen[basic] begann bereits in den 1980er Jahren und war als Basisversion zur Erprobung eines Führungskräftescreenings gedacht. Im Verlauf der Brauchbarkeitsuntersuchungen und Erprobung kristallisierte es sich als ein eigenständiges Screening zur Erfassung berufsrelevanter Eigenschaften heraus. Per-Screen[basic] folgt einem indirekten Ansatz. Diesem liegt im Wesentlichen die Auffassung zugrunde, dass sich Persönlichkeitseigenschaften Anlagen und Umwelt bedingt in typischen Verhaltensweisen ausdrücken und durch diese wiederum als Dispositionen des Handelns und Verhaltens gefestigt und modifiziert werden. Etwas einmalig Vererbtes sind sie nicht, sondern vielmehr als Produkt einer Anlage-Umwelt-Entwicklung auch veränderbar und situativ ausrichtbar. (vgl. z.B. A.N. LEONTJEW 1982; W. HACKER 2005, S.7; Uni-Protokolle 2011)

In diesem Zusammenhang wird festgestellt, dass ein Berufserfolg nicht ausschließlich mit spezifischen Persönlichkeitsmerkmalen eines Menschen zu erklären ist. ( vgl. L. von ROSENSTIEL/G. COMELLI 2003)
Aufgabeninhalte, Teamzusammensetzungen und situative Einflüsse haben ebenso Einfluss auf den Berufserfolg – besonders auf der motivationalen, volitiven und emotionalen Ebene.

Andererseits entsteht berufsrelevantes Verhalten nicht aus dem Nichts und zeigt sich in konkreten Situationen Ursachen bedingt, wobei die Verhaltensauslöser und –regulierer in erster Linie Persönlichkeitseigenschaften im Sinne von ‚traits‘ sein sollten, wohl wissend, dass sie es in manchen Fällen nicht allein sind.
Diese ‚traits‘, also über lange zeitliche Phasen sehr stabile Persönlichkeitseigenschaften, existieren in der Wechselwirkung mit ‚states‘, also sich mit den Umweltbedingungen verändernden, zeitlich eher kurzfristig vorliegenden Zuständen transsituationaler Konsistenz (vgl. M. SCHMITT, 1990) einer Persönlichkeit.

Wir möchten an dieser Stelle nicht weiter auf die theoretische und methodologische Grundlegung des Verfahrens eingehen, sondern uns in diesem Artikel ausschließlich Aussagen zu dessen Brauchbarkeitsprüfung zuwenden. Dabei ist es unumgänglich, sich immanent bewusst zu sein, dass Gütekriterien immer auf einer theoretisch und methodologisch begründeten Grundlage ihre Bewertung erfahren müssen.

Die Güte-Prüfung des Per-Screen[basic]

Die Güte-Prüfung einer Informationserfassungsmethode ist ein laufender, niemals abgeschlossener Prozess und kontinuierlich fortzusetzender Prozess des sich asymptotischen Annäherns an komplexe reale Gegebenheiten. In diesem Sinne sind die nachfolgend beschriebenen Aktivitäten als erste Schritte im Prozess der Güteprüfung zu verstehen.

  • Aussagen zur Validität

Der formal-technische Aspekt einer Güteprüfung ist dem inhaltlichen Aspekt der Abbildungspräzision eines Untersuchungsgegenstandes nachzuordnen.
Wird das Abbild des Untersuchungsgegenstandes originalinadäquat konstruiert, kann auch ein noch so ausgefeilter statistischer Überbau nichts mehr zur Nachweispräzision beitragen.
Ob das Verfahren das nachweist, was es nachweisen soll, ist die zentrale Frage jeder Güte-Prüfung und führt zur Rekonstruktion des Teils der objektiven Realität, auf den das Augenmerk gerichtet ist.(2)

Die grundlegende Frage, die die Güte des Per-Screen[basic] bestimmt, war somit die nach der Quelle aussagekräftiger Informationen über Verhaltensanforderungen für die erfolgreiche Bewältigung von Aufgaben in verschiedenen Arbeitswelten.
Wir sind der Auffassung, diese Quelle kann nur in den Arbeitswelten selbst bei den dort langjährig tätigen berufserfahrenen Akteuren liegen:

  • den kompetenten Arbeitern/Angestellten,
  • den erfahrenen Bereichs- und Abteilungsleitern,
  • den praxiserfahrenen Personalabteilungen und Geschäftsführungen.

Um eine hohe Sicherheit der aus den Screening-Resultaten abgeleiteten Aussagen anzustreben, wurde versucht, das Rekonstrukt von berufsrelevanten Persönlichkeitseigenschaften aus zugänglichen realen Arbeitswelten abzuleiten. Im Bewusstsein dieser modellhaften Einschränkung des Untersuchungsgegenstandes

  • wurde 1998 eine Analyse von Personalmanagementliteratur der Erscheinungsjahre 1971 bis 1998 durchgeführt:

Die Urliste kann unter Rekonstruktvalidät A eingesehen werden!

Aus der Analyse von 62 Werken resultierten 34 Persönlichkeitseigenschaften, die als „berufsrelevant“ eingestuft wurden.

  • Auf der Basis dieser 34 Eigenschaften wurden in den Jahren 1998 bis 2000 dann mehr als 300 europäische Unternehmen einer nach Angestelltenzahl geschichteten Stichprobe anonym befragt, welche Eigenschaften sie präferieren würden:

Die Urliste kann unter Rekonstruktvalidität B eingesehen werden!

Im Ergebnis dieser Befragung ergaben sich 18 invariante berufsrelevante Persönlichkeitsmerkmale, die durch vier Arbeitseinstellungen ergänzt wurden.

  • Diese 22 Merkmale wurden operationalisiert, in Indikatorbatterien abgebildet und zu einem Fragebogen ausgearbeitet:


Zur Festlegung der Indikatorinhalte und deren Formulierung fand eine Befragung zur Eignungsbewertung vorgegebener Indikatoren zum Aufdecken von Persönlichkeitsmerkmalen und Feststellen der am häufigsten als „geeignet“ bewerteten Formulierungen bzgl. einer Eigenschaft statt.

Die Urliste kann unter Rekonstruktvalidität C eingesehen werden!

168 von 195 vorgeschlagenen eigenschaftsbezogenen Indikatoren und deren Formulierungen wurden verifiziert, wobei 41 Indikatoren gleichen Wortlautes für die Indikation mehrerer (2 bis 3) Eigenschaften ausgewählt wurden.

  • Eine sich anschließende „Befragung der Befragung“ gab Aufschluss über das semantische Differential der 168 Indikatoren in Bezug auf die Klientel. Die Indikatoren unterlagen einer Testung des semantischen Differentials ab einer Altersgruppe von jungen Erwachsenen (18- bis 30 -jährigen).

Die Urliste kann unter Semantisches Differential eingesehen werden!

Es waren 11 Änderungshinweise folgender Art zu 9 (7%) von 127 (100%) Indikatoren zu verzeichnen:

  • Der respondentive Teil des Indikators wurde als 4-stufige Ordinalskala (Intensitätsskala) mit den Graduierungen „stimmt vollkommen“, „stimmt größtenteils“, „stimmt weniger“ und „stimmt gar nicht“ festgelegt.Der Grund dafür lag in den Erfahrungen mit dem Antwortverhalten der Klientel bei der Testung vorausgegangener Informationserfassungsmethoden:
  • Es bestand der Wunsch zu einer „Mitte“, um Entscheidungen und ein intensiveres Nachdenken über den im evokativen Teil des Indikators angesprochenen Sachverhalt in Bezug auf die eigene Person zu vermeiden,
  • Bei nicht Vorhandensein einer Mitte bestand die Forderung nach ausdifferenzierteren Skalen bis zu einer Skalenweite von 10, um letztlich zur Mitte durch lediglich geringe Abweichungen von ihr zu tendieren und andererseits die Pole durch geringe Abweichungen von denselben zu vermeiden.

Für die Befragung und dem intendierten Entscheidungsverhalten zu den
angesprochenen Inhalten reichen Tendenzen, die kurz über dem Alternativniveau
liegen. Es wird nichts „gemessen“, wir bilden homomorph ab und es nutzen in Bezug
auf unser Klientel mit seinem Antwortverhalten keine mehrstufigen Skalen, die sich
letztlich statistisch in der topologischen Verarbeitung dann wieder reduzieren.

Generell ist die Rekonstruktvalidität ist am theoretischen Modell orientiert für Per-Screen[basic] als gut einzuschätzen.

Die Prädikative Validität konnte für die 22 Eigenschaften auf der Basis von beobachteten Verhaltensmustern im Berufsfeld nach Einstellungsverfahren unter Mit-Zugrundelegung von Per-Screen[basic] – Ergebnissen nachgewiesen werden.
Dazu wurden in 5 Unternehmen 87 Interviews mit nach Alter, Geschlecht, Funktion und Arbeitserfahrung (in Jahren) geschichteten Personen durchgeführt.

Die Urliste kann unter Prädikative Validität eingesehen werden!

Die Signifikanzprüfung über den Zufallshöchstwert τ**max (L. KAARSEMAKER; A. VAN WINJNGAARDEN 1952[2]) ergab bei einem α von 5% und einem doppelt bindungskorrigiertem KENDALL-τ von τ**= 0,37 einen signifikanten Zusammenhang zwischen den beobachteten und nachgewiesenen Verhaltensmustern.

Aussagen zur Reliabilität

Die Antwortzulässigkeit (Indikatorreliabilität) wurde nach dem Rangsummenverfahren von F. WILCOXEN (1945)[8] mit einer Wiederholung nach 2 Monaten mittels Retest an einer Stichprobe von n = 97 für jeden der Indikatoren unter der Berücksichtigung Nullpaar eliminierter Summen über die auf die Prüfgröße |u| normierten T-Werte bzw. über T ermittelt.

Die Urliste kann unter Indikator-Reliabilität eingesehen werden!

Es liegen bei einer angenommenen statistischen Sicherheit von 95% keine signifikanten Veränderungen zwischen den Ergebnissen der Erst- und Zweitbefragung vor.

Aussagen zur Objektivität

Verfälschungstendenzen in der Durchführungs- und Auswertungsphase des Screenings im Sinne der Bedingungskonstanz werden durch genaue Instruktionen, probandenbezogene verständliche Indikatorformulierungen einfache und übersichtliche Beantwortungsmodalitäten sowie computergestützte Datenauswertungen minimiert.
Zur Durchführung des Screenings existieren Instruktionen und Interpretationshinweise, die für Störgrößen im Befragungs-, Auswertungs- und Interpretationsprozess sowie deren Minimierung bzw. Vermeidung sensibilisieren und auf den Aussagewert der erhaltenen Informationen hinweisen. Gleichwohl wird darauf verwiesen, dass die Interpreterkonkordanz immer auch von der psychologischen Qualifizierung sowie der Erfahrung des Interpreters bei der Betrachtung und Bewertung des Probandenkreises abhängig ist und Interpreterschulungen für Nicht-Testpsychologen zu empfehlen sind.

Aussagen zur Utilität

Das Screening lässt sich in seiner Durchführung leicht handhaben. Große psychische Belastungen der Befragten sind mit dem Einsatz des Screenings nicht verbunden. Der Umfang der zu erwartenden Informationen und deren wechselseitige Beziehungen sind insgesamt groß. Da die Informationen in numerischer Form vorliegen, sind sie statistisch interpretierbar.

Die Urliste kann unter Utilität eingesehen werden!

Auf einer sechsstufigen Skala von „gar nicht brauchbar“ bis „sehr gut brauchbar“ schätzten die Befragten das Verfahren zu 44% mit „sehr gut brauchbar“ und zu 46% mit „gut brauchbar“ ein. 10% gaben an, dass das Screening „schon brauchbar“ wäre.

Resümee

Per-Screen[basic] ist hinsichtlich der Präzisionskriterien einer Brauchbarkeitsprüfung generell
als ein einsetzbares Persönlichkeits-Screening zu werten.

Die Überprüfung, inwieweit sich einzelne Persönlichkeitseigenschaften als latente Variablen durch ein nomologisches Netzwerk implizit aufklären lassen und der damit verbundene statistische Nachweis der Konstruktvalidität in der Betrachtung von Konvergenz und Diskriminanz (vgl. M. KLEINMANN 1997) verschiedener Konstrukte könnte unter der Bedingung erfolgen, dass es für eine relativ sichere Aussage hinsichtlich der kriterienbezogenen Validität immer eines gesicherten Kriterienfächers dedarf.
Eine weitere periodische Brauchbarkeitsprüfung durch unabhängige Außengutachter ist für den Aktualitätsbestand des Per-Screen[basic] ist zu empfehlen.

Literatur

  • Hacker, W. (2005). Allgemeine Arbeitspsychologie. Psychische Regulation von Wissens-, Denk- und körperlicher Arbeit. Bern: Huber-Verlag.
  • Kaarsemaker, L. and van Wijngaarden, Adriaan (1952): Tables for use in rank correlation. Computation Department, Mathematisch Centrum. Amsterdam: Rep. R 73. pp 1 +17.
  • Kleinmann, Martin (1997): Assessment-Center: Stand der Forschung – Konsequenzen für die Praxis., Schriftenreihe. Göttingen: Verlag für Angewandte Psychologie.
  • Leontjew, Alexej Nikolajew (1982): Tätigkeit, Bewußtsein, Persönlichkeit. In: Studien zur Kritischen Psychologie. Köln.
  • Rosenstiel, Lutz von und Comelli, Gerhardt (2003): Führung durch Motivation. Mitarbeiter für Organisationsziele gewinnen. München: Vahlen-Verlag (3. Aufl.)
  • Schmitt, Manfred (1990): Konsistenz als Persönlichkeitseigenschaft. Berlin: Springer-Verlag.
  • Uni-Protokolle (2011): Zur Handlung unter dem Gesichtspunkt der psychischen Regulation. In: www.uni-protokolle.de/Lexikon/Handlung.html
  • Wilcoxon, Frank (1945): Biometrics Bulletin, International Biometric Society, 1444 I Street NW, Suite 700. Washington, DC 20005-2210 USA. Vol. 1, No. 6. (Dec., 1945), pp. 80-83.

1 Unter Kompetenz verstehen wir ein komplexes Gebilde aus sich in Kenntnissen manifestierendem angeeigneten Wissen, das als Grundlage zur Anbahnung von Können (Fähigkeiten, Fertigkeiten und Gewohnheiten) dient, welches wiederum durch praktische Erfahrungen in verschiedenen Bedingungsfeldern angereichert wird.

2 Eine Einordnung des Screenings in nomologische Netze erfolgte aus Gründen der nicht a priori gegebenen Vergleichbarkeit mit anderen Verfahren als Gesamtkonstrukt nicht. Selbst bei einem Abgleich mit bekannten hochvaliden Verfahren zur Feststellung der entsprechenden Eigenschaftsausprägungen würde die Prüfung des Kriteriums auf Gültigkeit ein Kriterium auf Gültigkeit des Vergleichskriteriums voraussetzen und schließlich dieses wieder ein Kriterium auf Gültigkeit für dieses Kriterium usw. Zum anderen bedarf die kriterienbezogene Validität für eine relativ sichere Aussage immer eines Kriterienfächers und auch die logische Validität leitet ihren Gültigkeitsanspruch aus Verfahren zum Nachweis von Merkmalen ab, die sich in eindeutigen und in ihrer Gesamtheit umschreibbaren Verhaltensweisen manifestieren.

Schreibe einen Kommentar