In un recente studio, condotto da un gruppo di ricercatori del Dipartimento di Intelligenza Artificiale dell’Universidad Politécnica de Madrid (UPM) e pubblicato su Bioinformatics, sono stati sviluppati diversi modelli in grado di predire il numero totale di citazioni che un articolo pubblicato otterrà.
Visto il gran numero articoli scientifici pubblicati, gli editori si trovano a dover scegliere tra pubblicare articoli di alta qualità o pubblicare quelli che consentono di ottenere il maggior numero di potenziali lettori.
Per valutare i risultati della ricerca scientifica in modo oggettivo, sono state sviluppate delle misure quantitative associate alle pubblicazioni. Una di queste è il numero di citazioni che un articolo riceve in un determinato periodo. Sebbene il numero di citazioni sia una misura della visibilità, potrebbe anche essere considerata come una misura indiretta della qualità di un lavoro.
Un gruppo di ricercatori della Facoltà di Informatica dell’UPM ha sviluppato modelli in grado di predire il numero di citazioni che gli articoli pubblicati sul giornale Bioinformatics (la rivista dove sono stati applicati i modelli) avranno ogni anno nei quattro anni successivi alla pubblicazione.
Per la costruzione dei modelli sono state usate delle variabili predittore, una selezione di alcune parole chiave selezionate automaticamente dagli abstract degli articoli, delle variabili relative alle aree di pubblicazione degli articoli e le date di pubblicazione. Grazie alle variabili predittore usate, si riesce a predire il numero di citazioni che un articolo otterrà.
La percentuale di accuratezza di questi modelli dipende dall’area della pubblicazione così come dall’articolo e dal metodo di predizione usato. Dopo aver fatto differenti previsioni sulle possibili combinazioni di area, anno e metodo, è stato ottenuto un successo del 91.8% in ognuna delle possibili aree e anni.
Grazie a questi modelli si è notato come la presenza di alcune parole nell’abstract degli articoli sia legata al numero di citazioni ottenute. Tali parole possono essere usate come punto di riferimento per identificare temi attuali.
Il maggior vantaggio che questi modelli offrono rispetto ad altri è la possibilità di predire il numero di citazioni che un articolo avrà nel primo anno, perché applicabili al momento della pubblicazione.
Bibliografia completa: Bioinformatics, 25, 3303-3309 (2009). “Predicting citation count of Bioinformatics papers within four years of publication. Ibanez, A., Larrañaga, P. and Bielza, C.