Elemento chiave di questo tipo di ricerca è la matrice dei dati, ossia una tabella rettangolare composta da tante righe quanti sono i referenti sotto esame (ad esempio gli allievi di una classe, le scuole di una provincia) e tante colonne quanti sono i fattori presi in considerazione per ciascun referente (ad esempio genere, numero fratelli, voto in matematica, per gli allievi di una classe, oppure ubicazione, numero di allievi, servizi offerti, per le scuole della provincia). Ciascuna riga corrisponde ad un caso (ad esempio un soggetto o una scuola) e ciascuna colonna corrisponde ad una variabile (che è l’equivalente matematico del fattore considerato), e la matrice viene quindi detta anche matrice casi per variabili. All’incrocio di ciascuna riga e colonna è presente un dato, ossia il valore assunto da quella specifica variabile per quello specifico caso. La matrice dei dati può essere caricata su calcolatore attraverso un foglio elettronico quale ad esempio Excel.

Ciascun questionario dà origine ad un record, ossia una riga, sulla matrice dei dati. Ogni domanda del questionario dà origine a una o più variabili a seconda di quante risposte può dare il soggetto a ciascuna domanda (detta anche item), come illustrato nel questionario dell’esempio sottoriportato, che ha dato origine alla prima riga della matrice vista sopra.
In tale esempio, alla domanda 3 il rispondente può barrare una sola risposta (o è maschio o è femmina) quindi la variabile generata è una sola (V3) e vale 1 se il soggetto è maschio, 2 se il soggetto è femmina. Alla domanda 5 il soggetto può barrare più di una risposta, quindi le variabili generate sono tante quante sono le risposte possibili (V5_1, V5_2, V5_3, V5_4) e valgono 0 se la casella corrispondente non è barrata, 1 se lo è.