© 2005 Miguel Ángel Gallardo Ortiz, con e-mail miguel@cita.es
© 2005 Cooperación
Internacional en Tecnologías Avanzadas
(C.I.T.A.) SL, http://www.cita.es
Reservados todos los derechos
Caso real de peritaje de identificación de voz para una Audiencia Provincial
Versión completa con gráficos en http://www.cita.es/fonogramas/peritaje.pdf
Documento policial escaneado en http://www.cita.es/fonogramas/policia.pdf
Documento enlazado desde http://www.cita.es/fonogramas
Antecedentes
A
primeros de marzo de 2005, el abogado defensor del único acusado en este
procedimiento penal me llamó por teléfono después de haber leído varias páginas
del dominio de mi empresa en Internet www.cita.es
dedicadas a la peritación tecnológica, considerándome por ellas bien capacitado
para la realización y ratificación de este documento. Debo empezar así por
dejar clara constancia de que ni el abogado, ni el acusado, me conocían hasta
entonces, ni yo a ellos.
El
letrado me expuso la situación de su defendido explicándome que la única prueba
en su contra es el INFORME PERICIAL
DE ANÁLISIS DE VOZ realizado por la COMISARÍA GENERAL DE POLICÍA
CIENTÍFICA de la DIRECCIÓN GENERAL DE LA POLICÍA que consta en los autos
(folios 167 y siguientes), que contiene una única conclusión (folio 172) del
funcionario del Cuerpo Nacional de Policía que “tiene la convicción de que ambas voces han sido realizadas por la misma persona, situándose la
conclusión alcanzada en el NIVEL DE
IDENTIFICACIÓN”. Tanto el letrado como su defendido me aseguran que no puede
ser así, porque las voces tienen que ser necesariamente distintas al negar el
acusado las relaciones con otros implicados y, con toda seguridad, por no haber
participado en ninguna de las conversaciones transcritas de 4 cintas de
grabaciones telefónicas que constan en los folios numerados 17-35. Por ello, el
acusado y su abogado solicitan mis servicios profesionales para realizar una
peritación de parte, con la urgencia y el rigor que se precisa.
Atendiendo
a la petición del letrado defensor, y especialmente a la providencia de la Sala
de19/04/05 requiriendo este documento antes del 14/05/2005, se estructura la
opinión pericial en cuatro apartados que se consideran relacionados e
inseparables, y así se ofrece a la Sala:
1.-
Crítica de la investigación policial, y a sus más preocupantes carencias
2.-
Crítica de la(s) metodología(s) de identificación de voces en el ámbito forense
3.-
Crítica del informe pericial de análisis de voz de los folios 167 y siguientes
4.-
Propuestas positivas para una mejor identificación en situaciones similares
y 5.- C
O N C L U S I O N E S
Este
informe, que sería más adecuado denominar dictamen pericial porque pretende
aportar más criterio que datos testimoniales (de los que lamentablemente no se
dispone pese a haberse solicitado expresamente dejando constancia aquí de mi
respetuosa primera protesta porque la Sala ha considerado que “...no ha
lugar a lo solicitado en cuanto a que se faciliten al perito de su parte otros
datos sobre los medios utilizados por la policía científica ni darle acceso a
ellos ni sobre los detalles gráficos que recaba que no estén reflejados en el
informe que está unido a los autos...”) no pretende en modo alguno hacer
ninguna otra argumentación que no sea probatoria, pero sí que, con todo respeto
hacia cualquier subjetividad, especialmente de jueces y funcionarios de
policía, trata de evidenciar que no hay (porque no puede haber) certeza
absoluta nunca sobre lo que, incluso con las mejores tecnologías actuales, NO
puede conseguirse certeza objetiva, científicamente. Y ésta es una
conclusión muy trascendental, aquí, y ahora.
1.- Crítica de la investigación policial, y a sus
más preocupantes carencias
En
la ORDEN DE 10 DE SEPTIEMBRE DE 2001 POR LA QUE SE DESARROLLA LA ESTRUCTURA
ORGÁNICA Y FUNCIONES DE LOS SERVICIOS CENTRALES Y PERIFÉRICOS DE LA DIRECCIÓN
GENERAL DE LA POLICÍA, en lo que aquí resulta más relevante, en el Artículo 9.
se define la composición y funciones de Comisaría General de Policía
Científica, integrada por Uno. Jefatura de Coordinación
y Apoyo Técnico: En su función de apoyo y asistencia a la Comisaría General,
analiza y planifica sus líneas generales de actuación, y gestiona los asuntos
relativos al régimen de personal y medios adscritos a la misma.
Se responsabiliza además de los bancos de datos propios de la
Comisaría General, así como de las actividades en materia de investigación y
desarrollo. Su titular, como segundo jefe de la Comisaría General, sustituye al
Comisario general en los casos de vacante, ausencia o enfermedad, y Dos.
Unidad de Criminalística: Asume las funciones relacionadas con las áreas de
criminalística, identificación, analítica e investigación técnica, así como la elaboración de informes periciales y
documentales.
Pues
bien, de todos los bancos de datos policiales, sin duda alguna, los más
relevantes para este dictamen se encuentran relacionados con el fichero
policial denominado oficialmente como "LOCUPOL", que
según la ORDEN INT/1751/2002, DE 20 DE JUNIO DE 2002, POR LA QUE SE REGULAN LOS
FICHEROS INFORMÁTICOS DE LA DIRECCIÓN GENERAL DE LA POLICÍA QUE CONTIENEN DATOS
DE CARÁCTER PERSONAL, ADECUÁNDOLOS A LAS PREVISIONES ESTABLECIDAS EN LA LEY
ORGÁNICA 15/1999, DE 13 DICIEMBRE, DE PROTECCIÓN DE DATOS DE CARÁCTER PERSONAL,
Y DEMÁS NORMATIVA SOBRE LA MATERIA, está formado por los datos de “Personas
que voluntariamente o por orden judicial, presten su voz, siempre que
las características de tal emisión se adecuen a los objetivos y procedimientos
de análisis relacionados con las investigaciones correspondientes”. El fichero
policial "LOCUPOL", requiere medidas de seguridad de
nivel alto, y su órgano responsable es la Comisaría General de Policía
Científica, en calle Julián González Segador, sin número, 28033 Madrid. "LOCUPOL",
representa en sí mismo, toda la incertidumbre, problemática y complejidad
técnica que la misma policía reconoce que existen en la identificación de voces
dubitadas, aparentemente obviadas en este caso. La casuística de "LOCUPOL"
ha de ser muy amplia, y muy probablemente, las llamadas internacionales
intervenidas y la identificación de hablantes de idiomas, dialectos y
procedencias geográficas muy diversas, puede y debe evidenciar que, sólo en
casos muy extremos, con acentos característicos, o con diferencias de voces muy
marcadas, puede considerarse algo más segura que la de españoles, mucho más
difíciles de identificar por lo común de sus voces aquí.
Con
independencia del número total de registros de los que conste el fichero
policial "LOCUPOL", desde que se registró por primera
vez en 1994 ante la Agencia de Protección de Datos, y de cuantas identidades y
voces de distintas personas se vayan incorporando en diferentes circunstancias,
aquí es importante diferenciar claramente las voces dubitadas
(intervenciones telefónicas con conversaciones negadas por alguno o por ambos
interlocutores), de las voces indubitadas obtenidas por toma de
muestras de voz como la tomada judicialmente, en este caso, a las 11:00 horas
del 28 de julio de 2004, ante el Secretario Judicial.
Los
teléfonos intervenidos, en principio, están sistemáticamente asociados, al
menos, a una de las voces (en ocasiones, un mismo teléfono intervenido puede
ser utilizado por varios hablantes) que es la que resulta más fácil identificar
porque es la que motiva la intervención judicial, mientras que el otro número
telefónico, en principio, es usado por un desconocido cuyo teléfono no está
intervenido. Sin embargo, como puede obtenerse fácilmente este segundo número
telefónico, lo lógico, sensato, prudente y más correcto para la investigación
policial, es que si el desconocido con su voz dubitada es considerado en algún
momento cómplice, o cooperador, antes de hacer imputaciones penales, se
intervenga también su teléfono.
En
este caso, no solamente no se ha intervenido el teléfono del desconocido, sino
que parece que ni siquiera constan otros números de teléfono a los que el
desconocido llamó, lo que facilitaría mucho su más segura identificación por
evidenciar otras relaciones comprobables. Esta carencia, en pura técnica de
investigación policial-pericial, resulta extremadamente grave en las
circunstancias en las que se juzga este caso, y en mi opinión, debería de
justificarse, porque no es correcto, ni prudente, ni sensato, ni lógico, hacer
imputaciones, procesamientos y juicios, antes de agotar las posibilidades de
investigación para la instrucción judicial más precisa.
Sean
cuales sean las razones por las que el teléfono del desconocido
(al que parece ser que sólo se le puede identificar por la voz cotejada con la
muestra tomada) no ha sido intervenido por orden judicial, deben de ser
analizadas muy críticamente. Y a este perito, le interesan como también
le interesan todas y cada una de las identificaciones periciales de voz que
estén referenciadas en el fichero policial "LOCUPOL" en
parecidas circunstancias, porque aquí está en juego toda la legitimidad de
cualquier otra toma de muestra de voz para este tipo de fines.
Más
allá de las particulares circunstancias del caso, las declaraciones del
Secretario de Estado para la Seguridad, Antonio Camacho, a Europa Press del
25/11/2004 en las que “pide un esfuerzo 'permanente' para adaptar los avances
científicos y tecnológicos a la lucha contra el crimen” y menciona
expresamente el Sistema Integrado de Interceptación Telefónica (SITEL)
que posibilita acceder en tiempo real a los mismos datos que las compañías
telefónicas, y del que los jueces (no los particulares, ni los peritos de
parte) pueden obtener información técnica detallada. Su plena operatividad en
las fechas de las escuchas, hace especialmente grave que no se utilicen más
eficazmente todos los medios técnicos de los que ya dispone la policía, sin
explicarlo. Las mencionadas declaraciones del Secretario de Estado para la
Seguridad, y algunos detalles del sistema SITEL,
están publicadas en http://www.cita.es/fonogramas
En
este punto, no se está criticando todavía ni el resultado, ni el método
supuestamente empleado en la peritación policial, sino que se critica esta mala
política, y la falta de norma policial específica, hasta llegar a elevar estas
quejas a sus últimos responsables, el Ministro del Interior y la Secretaría de
Estado para la Seguridad, porque si no se utilizan eficazmente los medios de
seguimiento, y confirmación-verificación de identidades de sospechosos, y se
sobrevaloran caros, ocultos, indocumentables, antiguos, complejos y dudosos
sistemas criminalísticos, el diagnóstico y el pronóstico criminológicos son,
ciertamente, muy preocupantes para tan sensible actividad policial como es la
que se ha pretendido legitimar en el informe de identificación de voces al que,
con mis respetos, se opone éste, muy firmemente.
2.-
Crítica de la(s) metodología(s) de identificación de voces en el ámbito forense
La
identificación de personas por sus voces es una técnica criminalística,
dependiente de la biometría, y en última instancia, de las ciencias de la
identificación en su último límite ontológico y metafísico más riguroso
posible, en cada estado del arte.
Pero
hay una consideración, en el sentido más convincente de la Filosofía de la
Ciencia, que diferencia las identificaciones antropológicas, de las que
pretenden atribuir autorías por los actos, como es el caso de la grafología, y
también el de la fonética forense. Una cosa es identificar por partes
características e inseparables de un ser hasta llegar a lo infalsificable (al
menos sin que se note, o se pueda evidenciar tecnológicamente), en un cuerpo
humano, y otra cosa muy distinta es identificar a los seres humanos por lo que
hacen (escribir, pintar, andar, o hablar, entre otras muchas actividades más o
menos fiablemente identificables). Somos lo que somos, y no lo que hacemos,
porque todo lo que hacemos o decimos, puede ser también hecho o dicho por
otros. Confundir lo que somos con lo
que hacemos, o con lo que decimos, o con cómo lo decimos, es inaceptable en
términos policiales y judiciales.
Así,
todos los expertos con capacidad y cualificación criminalística
multidisciplinar coinciden en que el ADN, la dactiloscopia, y en general, la
antropometría forense, son incomparablemente más resolutivas y concluyentes que
la acústica forense, y muchos consideramos que la voz es sólo un indicio de la
identidad (quizá un buen indicio, pero sólo un indicio) que nunca, en ningún
caso, puede ser una prueba inculpatoria suficiente, con independencia de las
tecnologías y los métodos empleados para identificar por la voz. Sí que, en
ciertos casos, podría ser una prueba exculpatoria, porque algunas voces están
completamente fuera del alcance de algunas gargantas con sus siempre limitadas
cuerdas vocales, pero todos los fonemas y alófonos que puede emitir un ser
humano, también están al alcance de otros, y más aún si se considera que pueden
ser sintetizados artificialmente. Esta incertidumbre forense no existe con la
identificación por ADN, y está mucho más controlada en dactiloscopia y otras
especialidades antropométricas, que en la siempre dudosa identificación por
voz.
Además,
la fonética, al igual que la grafología, no pueden ser consideradas “ciencias
duras”, sino que son “ciencias blandas”, que en ningún caso dejan de estar
basadas en la interpretación y que por lo tanto, por muy amplia, profunda y
antigua que sea la experiencia del perito y por muy creíble que resulte su presunción
de veracidad, no deja de ser subjetivo, indirecto y periférico.
Desde
esta perspectiva crítica, muy respetuosamente se quiere dejar constancia aquí
de que no puede aceptarse, ni debería de ser admitido en buen juicio,
un informe policial de identificación que no hace referencia a ninguna
metodología o normativa concreta, y que considera en sus “BASES
CIENTÍFICAS” que la identificación forense implica “un análisis no
necesariamente sistemático”, evaluando en cada registro “parámetros en
función de su relevancia para aportar características individuales al estudio
pericial”.
Este
perito no puede estar mayor en desacuerdo con lo expuesto por la policía en las
supuestas “BASES CIENTÍFICAS” de los folios 168 y 169, y mucho
más allá de cuanto sea aplicable a este caso particular, como criminólogo y
criminalista, manifiesto mi más enérgico y radical rechazo del planteamiento
subjetivista y apodíctico, criticando éste, y también cualquier otro informe
policial que tenga las mismas o parecidas “BASES CIENTÍFICAS”.
Pero no se trata aquí de dar importancia a la opinión de un perito como yo,
sino de probar que, con carácter general, la identificación policial de una voz
no es suficiente, no puede ni debe ser suficiente, para imputar delitos, y
menos aún, para condenar nunca, en ningún caso, sólo por una apariencia de
identidad, en países civilizados con mínimas garantías constitucionales.
La
publicación internacional más concluyente para alertar sobre los riesgos de
sobrevalorar la identificación de voces al alcance de este perito, ahora, tiene
la siguiente referencia:
Person Authentication by Voice: A Need for Caution
Jean-François Bonastre,1,3 Frédéric Bimbot,1,4 Louis-Jean Boë,1,5
Joseph P. Campbell,2,6* Douglas A. Reynolds,2,6* Ivan Magrin-Chagnolleau 2,7
(1) Association Francophone de
la Communication Parlée (AFCP)
jfb@lia.univ-avignon.fr, frederic.bimbot@irisa.fr, boe@icp.inpg.fr
(2) Speaker and Language
Characterization (SpLC) SIG
j.campbell@ieee.org, dar@ll.mit.edu, ivan@ieee.org
(3) LIA, Université d’Avignon, BP 1228, 84911 Avignon CEDEX 9, France
(4) IRISA, Pièce A 123, Campus Universitaire de Beaulieu, 35042 Rennes CEDEX,
France (5) ICP, Université Stendhal, BP 25, 38040 Grenoble CEDEX 09, France (6)
MIT Lincoln Laboratory, Lexington, Massachusetts 02420, USA (7) DDL, CNRS &
Université Lyon 2, 14 Avenue Berthelot, 69363 Lyon CEDEX 07, France
* These
authors are sponsored by the United States Government’s Technical Support
Working Group and the Federal Bureau of Investigation under
Air Force Contract F19628-00-C-0002. Opinions, interpretations, conclusions,
and recommendations are those of the authors and are not necessarily endorsed
by the United States Government.
Publicado en EUROSPEECH 2003 – GENEVA
1 The AFCP was initiated by the Groupe Francophone de la
Communication Parlée (GFCP) of the Société Française d’Acoustique
(SFA) in November 2001: http://www.afcp-parole.org/.
2 The SpLC is a special interest group of the
International Speech Communication Association (ISCA): http://www.splc-isca.org
El
“abstract” de este artículo, que este perito comparte por completo, dice
literalmente:
Because of recent events
and as members of the scientific community working in the field of speech
processing, we feel compelled to publicize our views concerning the possibility
of identifying or authenticating a person from his or her voice. The need for a
clear and common message was indeed shown by the diversity of information that
has been circulating on this matter in the media and general public over the
past year. In a press release initiated by the AFCP and further elaborated in
collaboration with the SpLC ISCA-SIG, the two groups herein discuss and present
a summary of the current state of scientific knowledge and technological
development in the field of speaker recognition, in accessible wording for
nonspecialists. Our main conclusion is that, despite the existence of technological
solutions to some constrained applications, at the present time, there
is no scientific process that enables one to uniquely characterize a person’s
voice or to identify with absolute certainty an individual from his or her
voice.
Es
decir, que “en el momento presente no hay procedimiento científico que
capacite para caracterizar únicamente a la voz de una persona o para
identificar por su voz, con absoluta certeza, a un individuo”
(traducción del perito).
El
primer autor y coordinador de este trabajo, en el que participan dos
norteamericanos financiados por el Federal Bureau of Investigation (FBI) y el
gobierno de los EEUU, es una muy respetada referencia internacional para todos
los expertos en identificación forense de voces. El Profesor Jean-François
Bonastre, ha tenido la amabilidad de mostrar expresamente su apoyo a lo que,
con carácter general y doctrinal, pretende este perito para provocar la
reflexión crítica, y más prudente, de policías y jueces en España hacia las
malas identificaciones de voz, mediante una carta de fecha 3 de mayo de 2005 en
la que literalmente puede leerse:
Dear
Miguel A. Gallardo Ortiz,
I want to confirm,
as highlighted in the paper Bonastre et al. EUROSPEECH 2003, GENEVA, that a
maximum level of caution should be taken for an forensic speaker
authentication. The conditions authorizing to conclude scientifically to a
positive or a negative authentication using the voice, with a strong level of
confidence, are very hard to obtain.
I want also to
reaffirm that the main problem is not the level of competence of the expert but
the scientific aspects of the expertise. In order to proceed at an scientific
authentication, several factors should be respected. The Daubert factors are a
good example of that. One of the main
aspect is the repeatability of the analysis. It includes to describe
the method used and to authorize a criticism of this method by the
researchers. (continúa ofreciendo más detalles)
Lo que el Profesor Bonastre denomina “factores Daubert” no son sino las exigencias que impuso la Corte Suprema de los Estados Unidos, en su decisión 509 U.S. 579 de 1993 (este perito, con todo respeto, recomienda a la Sala que solicite información al servicio de documentación de la embajada de EEUU en Madrid respecto al relevante caso judicial “Daubert v. Merrell Dow Pharmaceuticals”, 509 U.S. 579, 113 S. Ct. 2786, 125 L. Ed. 2d 469, 1993) para aceptar en juicio una evidencia como científica, y que, en su TEORÍA y TÉCNICA, son:
• The theory or
technique has been or can be tested. QUE HAYA SIDO O PUEDA SER COMPROBADA
• The theory or
technique has been subjected to peer review and publication. “ ” REVISABLE-PUBLICABLE
• The existence and
maintenance of standards controlling use of the technique. “ ” NORMALIZADA
• General acceptance
of the technique in the scientific community. “ ” ACEPTADA CIENTÍFICAMENTE
• A known or
potential rate of error (that is acceptable). ERROR POTENCIAL PRECISADO
(ACEPTABLE)
Lamentablemente, la Policía Científica española parece estar muy lejos de plantearse, con auténtico rigor científico, la problemática de la identificación forense de voces, a la vista de su informe, y también lo está la Sala, aunque sólo sea por permitir que se tenga que hacer así por este perito, porque respetuosamente debemos recordar que la Sala resolvió que “...no ha lugar a lo solicitado en cuanto a que se faciliten al perito de su parte otros datos sobre los medios utilizados por la policía científica ni darle acceso a ellos ni sobre los detalles gráficos que recaba que no estén reflejados en el informe que está unido a los autos...”) negando así la posibilidad técnica de repetir el controvertido análisis acústico-fonético (“repeatability” según la terminología más aceptada), como se evidenciará más adelante en la crítica del informe policial.
Con
el máximo respeto hacia el trabajo de la Policía Científica, para relativizar
la pretendida certeza en la identificación de voces, debería bastar la argumentación
científica del riguroso artículo citado, las observaciones de la carta del
Profesor Jean-François Bonastre y sus numerosas referencias respaldadas por
entidades francesas y norteamericanas de reconocida solvencia científica, con
especial atención a todos y cada uno de los “factores Daubert”.
Es
muy lamentable que en España se aporten a procedimientos judiciales supuestas “BASES
CIENTÍFICAS” como las de los folios 168 y 169, y sería deseable no sólo
que no se autorizasen, sino que todos y cada uno de los casos en los que se
hayan utilizado (probablemente copiándolas sin que pueda saberse su origen ni
el número de veces que se han pretendido aplicar a pruebas policiales de voz),
fueran sistemáticamente revisados, críticamente. Este perito se reserva el
derecho de dirigirse a autoridades policiales, fiscales y judiciales, españolas
y europeas, para intentar conseguirlo por todos los procedimientos posibles. Y
tratará de hacerlo con todos los apoyos internacionales que puedan contribuir a
generar una mayor sensibilidad en las autoridades policiales, utilizando, por
ejemplo, los artículos y las cartas como la que oportunamente me ha dirigido el
Profesor Jean-François Bonastre, aue finaliza con las frases:
Despite
the fact that I am not a good Spanish reader, I didn’t find any scientific
element in the document “bases cientificas” you forwarded to me which could
demonstrate that the described method authorizes a strong level of confidence,
particularly in the focus of an scientific expertise.
I
authorize Eng. Miguel A. Gallardo to forward my preliminary comments to Whom it
may concern in Spain.
La
motivación criminológica para evitar que pueda considerarse prueba lo que no
deja de ser un indicio, es doble. Por una parte, puede estar acusándose, y condenándose,
a un inocente, pero por otra, no menos preocupante, el auténtico culpable queda
impune. No es necesario hacer mucha memoria para recordar algún caso en el que
los errores judiciales han hecho posibles nuevos crímenes, y peores
organizaciones criminales, por una incorrecta investigación y errónea sentencia
de otros anteriores incorrectamente instruidos por una mala identificación.
En
EEUU se han publicado interesantes trabajos sobre los errores cometidos en la
identificación forense de voces (“Hearing Voices: Speaker Identification in
Court” Lawrence M. Solan y Peter M. Tiersma publicado en 2003 en University
of California, Hastings College of Law, y enviado directamente por su primer
autor a este perito por correo electrónico, interesándose por las
particularidades y detalles jurídicos y tecnológicos de esta peritación) en los
que se ha llegado a la conclusión de que no hay procedimiento tecnológico que
mejore la capacidad de diferenciar voces que tienen algunas personas
especialmente sensibles a la fonética humana (buen oído para diferenciar e
identificar voces) respecto a cualquier espectografía, muestreo estadístico de
pautas de voz, o a la poco probable automatización tecnológica de la
identificación de voces.
Todas
estas lecturas nos están haciendo pensar en mejores métodos para la
identificación policial de voces, y también para su necesaria contradicción
pericial en mejores condiciones que las actuales. Por una parte, hemos
comprobado que el acusado no duda al diferenciar su voz de las intervenidas a
pesar de que ambas las escuche por medio de otro teléfono móvil, y que su hijo
también haya acertado en alguna prueba a las que les hemos sometido. Sin
embargo, en partes muy cortas de conversación (frases como “le dijo a Diego”),
amigos del acusado no consiguen acertar en las mismas condiciones. Como no
podría ser de otra manera, es el propio acusado quien, pese al efecto
enrarecedor de escuchar la propia voz grabada, puede diferenciarla mejor de
otras, y también sus familiares más próximos, y más acostumbrados a su manera
de hablar.
En
todo caso, sería muy recomendable que existiera un jurado pericial
independiente con capacidad de cuestionar las identificaciones de voces con
consecuencias penales, porque es muy peligroso dejar en manos, o en los oídos,
de una sola persona, la condena de otra. Y más aún si esta se puede hacer uso
de medios, datos y gráficos desconocidos para el acusado y su perito, que ha
tenido que conseguir algunos ejemplos de análisis mediante KAY DSP 5500 en
viejos libros de fonética, completamente superados por tecnologías posteriores.
Los
antecedentes y circunstancias de este caso hacen muy recomendable que se
estudien todas las identificaciones negadas o controvertidas que ya consten en
el fichero policial "LOCUPOL", porque no se trata sólo
de refutar pericialmente una identificación, sino de cuestionar el método (o
más lamentablemente, la ausencia de método) policial que la ha hecho posible, y
en consecuencia, de pedir la revisión de cuantas otras identificaciones se hayan
hecho de la misma manera, siempre, repito una vez más, con mis máximos respetos
y sometiéndome a cualquier otra opinión mejor fundada que la que aquí se está
expresando, muy responsablemente.
3.-Crítica del informe pericial de análisis de voz
de los folios 167 y siguientes
La
crítica más positiva es la que indica cómo pueden hacerse mejor las cosas,
razonadamente, incluso cuando existe, como es el caso de las identificaciones
por voz, un límite científico que no puede ser sobrepasado, con certeza de que existe
tal límite.
En
lo que sigue, nos centraremos en cada uno de los apartados del informe policial
haciendo las consideraciones que en cada punto mejor evidencian que, desde
nuestra perspectiva, en este caso de análisis forense, lamentable e irresponsablemente,
se ha sobrepasado ese límite científico.
Sobre los medios técnicos empleados
por la policía
Según
los folios 169 y 170 son:
No
consta qué tipo de magnetófono o grabadora fue utilizado en la diligencia para
la toma de muestra de voz (ni si es el mismo magnetófono TASCAM 302 de la
policía, y tampoco si estaba calibrado y sincronizado adecuadamente, porque la
diferencia de velocidad afecta al tono), pero en cualquier caso, para tal toma no se utilizó un teléfono móvil
(no se puede precisar tampoco qué marca y modelo de móvil fue utilizado por el
desconocido, y da mucho que pensar que la Policía Científica se crea capaz de
identificar voces, y no teléfonos). La diferencia entre muestra dubitada e
indubitada es más que evidente, aunque sólo sea por el hecho de que una fue
grabada de un teléfono móvil, y la otra directamente. Más adelante se trata muy
críticamente de las cintas grabadas (muy probablemente también regrabadas), y
de su (mal) supuesta calidad.
Sobre
la estación de trabajo digital KAY DSP 5500 debe hacerse saber a la Sala que
fue diseñada a finales de los años 80, y comercializada por primera vez en
1989. Dejó de fabricarse hace unos 5 años según hemos consultado
telefónicamente a su distribuidor en exclusiva para España, cuyos datos son,
según http://www.kayelemetrics.com
Enrique
Salesa
Instituto
Auditivo Español SA
Pau
Claris, 98
Barcelona
- 08010, Spain
TEL:
34-93-317-35-70
FAX:
34-93-301-38-42
TEL:
34-1-521-78-79 (Madrid Office)
FAX:
34-1-523-15-93 (Madrid Office)
E-mail: psalesa@salesa.es
General Sales Info E-mail: info@salesa.es
Este
perito ha enviado un mensaje e-mail, y también impreso por fax, solicitando:
1.-
Un manual del KAY DSP 5500 y documentación técnica sobre su fiabilidad
2.-
Una relación, al menos estadística, de los fallos en la identificación de voces
En
mi opinión, que someto a cualquier otra mejor fundada, el derecho a la prueba
de la defensa debería facilitar el ejercicio del derecho a acceder a la
documentación técnica de los medios de prueba, y de los instrumentos utilizados
pericialmente por la acusación, como principio general del derecho pericial
dentro del derecho a la contradicción de pruebas.
El
mensaje e-mail y el fax fueron enviados a las oficinas de Madrid y Barcelona y
no se ha recibido ninguna respuesta, por lo que he recomendado a la defensa
letrada hacer cuantas gestiones y peticiones sean necesarias para evidenciar la
fiabilidad, y más aún la historia de los errores y fallos cometidos por los
sistemas KAY DSP 5500 y similares en la identificación policial de voces, así
como sobre cuantas advertencias y cautelas del fabricante
(Kayelemetrics/PENTAX) puedan conocerse al respecto.
Al
haber sido nula la colaboración prestada por la empresa que comercializa el KAY
DSP 5500 utilizado por la policía, me decidí a solicitar la colaboración
algunos expertos que me recomendaron ponerme en contacto con uno de sus
usuarios más críticos, Craig Dickson, Presidente de STR-SpeechTech Ltd., en
Canadá, quien me ha dirigido una carta que empieza por manifestar su total
acuerdo con el Prof. Bonastre, en estos términos:
Dear
Sr. Gallardo Ortiz,
The
EuroSpeech Article by Jean-Francois Bonastre et al. is a very good summary of
issues that are involved in the use of speaker identification for forensic
purposes. As such, it reflects my opinion regarding the serious need for
caution when using it as primary evidence in the courts.
Más
adelante, Craig Dickson me manifiesta, en relación al KAY DSP 5500 que:
Regarding
the use of the Kay DSP 5500, this is nothing more than a convenient
spectrographic analysis system. Nothing in that system is designed specifically
for speaker recognition tasks. A convenience in its design is that two
spectrograms from separate sources can be easily compared, which makes its use
for comparing known and unknown samples attractive.
I
do not have any information regarding the use of the DSP 5500 hardware for
successful vs. failed speaker identification cases, but I would suggest that,
since it is no more than an analysis tool, any wrong identification would fall
to the user of the equipment, and not the equipment itself.
En
este sentido, este perito considera que cualquier ordenador PC de cierta
calidad y menos de 3 años en el mercado, utilizando software adecuado, puede
realizar espectografías mucho mejor que cualquier sistema de hace más de 15
años que no puede conectarse a ningún ordenador, como es el lamentable caso del
KAY DSP 5500, pero se ha de insistir, una vez más, en que si no se ofrecen
gráficos de espectografías realizadas por la policía, no pueden comprobarse, y
en mi opinión, no debería admitirse un informe en el que se dice que se han
hecho, sin aportarlas.
Como
se detallará y explicará más adelante, la base y el criterio de cálculo, por
ejemplo, de las “referencias paramétricas
complementarias” de la policía son necesarias para explicar importantes
diferencias de magnitudes de hasta el 44% entre las voces dubitadas e
indubitadas según datos obtenidos por la policía, y que aunque sin explicar por
qué los consideran normales, resultan muy relevantes porque miden,
precisamente, características generales y permanentes de las diferentes voces.
Para comprender la trascendencia de este dato, nada mejor que disponer del
manual del sistema utilizado, como es el KAY DSP 5500 por parte de la policía.
Sobre la supuesta “calidad de las
grabaciones”
Los
funcionarios del Cuerpo Nacional de Policía “informan que las grabaciones de voz indubitada y dubitada, presentan
una calidad aceptable”, pero lo que en ninguna parte se constata es la gran diferencia de calidad entre
una (hay una sola cinta indubitada) y otras (hay cuatro cintas dubitadas),
teniendo en cuanta que la indubitada se realiza grabando directamente (dicho
sea de paso, de manera manifiestamente mejorable porque la señora Secretario
Judicial tiene mucho más cerca el micrófono que el acusado y hace necesario un
cuidadoso reajuste del volumen para su preciso análisis) pero las cintas
dubitadas proceden de “(re)grabaciones”
de conversaciones de teléfonos móviles que sistemáticamente mutilan muchos
armónicos y matices de la voz característicos de cada timbre particular, y que,
en mi opinión, resultan absolutamente imprescindibles para una correcta
identificación fonética como la pretendida, y no conseguida.
Merece
la pena extenderse en este punto, porque tenemos la fundada sospecha de que,
para realizar nuestro trabajo, no hemos estado, ni mucho menos, “en las mismas condiciones que la policía
científica en la elaboración del suyo” (según considera la Sala, en nuestra
respetuosa opinión, muy equivocada e injustamente, en la segunda página de la
providencia de fecha 14/05/05) porque con independencia de todo lo que se nos
deniega, las cintas dubitadas creemos que han sido regrabadas, perdiendo alguna
calidad, por estos motivos:
PRIMERO.-
He observado un hecho muy preocupante del que yo no soy responsable en
absoluto, porque buscando los pasos y las horas de las llamadas grabadas en las
cintas no hemos podido encontrar la conversación de la cinta MASTER 14 de fecha
09-10-2003, HORA: 16:42 PASOS 548 al 563 Cara: A (folio 37) que, curiosamente,
es la única que tampoco está referencia en la DILIGENCIA INFORME (folios 08 y
09) con los resúmenes de todas las llamadas según la Dirección General de la
Policía. En opinión de este perito, este hecho debería ser explicado por quien
corresponda, pero no por mí, que me limito a constatarlo sin encontrar huecos
ni borrados donde debería de estar lo que consta en las transcripciones,
repito, en el folio 37 y no está en el 09, donde también debería constar esa
relevante llamada, según la policía.
SEGUNDO.-
Apreciamos algunos otros efectos acústicos o electromagnéticos, por ejemplo, en
el minuto 02:36 aproximadamente de la cinta 11a-29-09-20,10, y también en el
00:20 aproximadamente en la cinta 12a-02-10-22,20 que nos hacen sospechar que
las cintas que se nos han proporcionado son grabaciones de otras, con casi
total seguridad, de mejor calidad, y lo que es más importante, que considerando
lo ya expuesto en el punto PRIMERO anterior, podría ser interpretado libremente
por la defensa del acusado (que es quien nos ha hecho notar la importancia de
estos efectos).
TERCERO.-
La grabación de conversaciones entre teléfonos móviles intervenidos debe
hacerse en formato digital adecuado a las características técnicas del sistema
GSM, por lo que cabe suponer que la policía dispone, o debería de disponer, de
grabaciones en archivos digitales de calidad muy superior a la de las cintas
analógicas que se nos han proporcionado. Recomendamos a la defensa letrada que
pregunte y repregunte hasta poder conocer los últimos detalles de las
grabaciones de la policía considerando las características y especificaciones
del Sistema Integrado de Interceptación Telefónica (SITEL) y las evidencias que puedan obtenerse del
fichero policial "LOCUPOL" en cuanto pueda afectar
técnicamente a la calidad de las grabaciones dubitadas, porque con peores
grabaciones es más difícil evidenciar las diferencias.
El
hecho de que a este perito se le proporcionasen “grabaciones de grabaciones”
afecta sistemáticamente a la capacidad de discriminar diferencias entre las
voces, por ejemplo, por haber alguna diferencia entre la velocidad de
grabación y reproducción entre unos y otros sistemas analógicos. Estas
diferencias debidas a falta de sincronismo, provocan, como mínimo, una diferencia
de tono más o menos grave o agudo, en una misma voz, en diferentes
grabaciones, además de la inevitable pérdida de calidad dada vez que se graba.
En nuestro caso, capturamos digitalmente la mejor reproducción de las cintas
proporcionadas, y por ello no hemos perdido ninguna calidad al ser estudiadas
las voces, por ser digitalmente ya inalterables.
Sobre el “estudio de percepción
auditiva” (de la policía)
El
único párrafo que el informe policial dedica a todo lo que pudiera transmitir
alguna confianza y credibilidad en la supuesta experiencia auditiva de la policía,
merece la más dura crítica que la Sala permita hacer a este perito, porque las
vagas generalidades mencionadas por la policía parecen cortadas y pegadas, en
definitiva, (mal) copiadas sistemáticamente de cualquier otro informe (pido que
esto se compruebe en los archivos policiales) y no señalan absolutamente
ninguna singularidad coincidente entre voces dubitadas e indubitadas. En mi
opinión, no puede admitirse, ni permitirse que, sin hacer ni una sola
referencia concreta a nada de lo escuchado, ni tampoco basándose en un criterio
o interpretación aplicable a esta identificación, nadie en nombre de la policía
se atreva a presentar a un juzgado una conclusión que literalmente es: “Los resultados
en esta fase de estudio son de un
alto nivel de similitud entre ambas voces”.
Se
puede cuestionar “la experiencia y
entrenamiento del experto para discriminar y contextualizar ciertas
características de los eventos hablados de un interlocutor determinado” precisamente,
por este párrafo que define por sí mismo la falta de rigor, y de dedicación, en
el estudio policial de las voces dubitadas e indubitadas, y a la controversia
de este caso concreto.
La
policía conoce, o debería de conocer, el lugar de residencia y también el de
nacimiento del acusado, por lo que es muy lamentable el que en ningún punto
de su informe haga la más mínima referencia a sus posibles influencias, en este
caso, valencianas. Pero además, las muestras de voz tomadas judicialmente
el 28 de julio de 2004 ante el Secretario Judicial, evidencian esa particular
pronunciación del acusado, que no se aprecia en la voz dubitada.
Posiblemente,
la sensibilidad hacia las pequeñas diferencias de entonaciones, rasgos
distintivos de fonemas y alófonos, reglas fonológicas y correlatos
articulatorios de la zona valenciana sean especialmente bien percibidos por
expertos bien entrenados, como por ejemplo lo son los técnicos de sonido que
trabajan para emisoras de radio, de lugares visitados por residentes en
Albacete y Valencia, como por ejemplo en Cuenca, Murcia o Alicante. Este perito
ha tenido algunas conversaciones informales con algunos profesionales de la
radio, que prefieren no ser referenciados para evitarse complicaciones, pero
que me han señalado algunas particularidades muy apreciables en los hablantes
incluso entre localidades muy próximas entre sí en la zona comprendida por las
provincias de Albacete, Cuenca, Valencia, Alicante y Murcia.
Una
de ellas, que puede ser fácilmente percibida en el acusado, es la “l” (ele) de
tendencia catalana, alveolar y más nasal en su muestra de voz indubitada que la
castellana típica del desconocido en las voces dubitadas de las conversaciones
telefónicas en las que el otro interlocutor evidencia influencias o características
propias del habla gitana. Basta prestar atención a las “eles” de uno
(valencianas-catalanoides) y otro (castellano-manchegas) para tener la
seguridad fonética de que se trata de personas distintas, por la diferencia
de pronunciación.
Lamentablemente,
el informe policial sólo divaga entre generalidades elementales, y no concreta
“las peculiaridades del sociolecto, las
realizaciones a nivel suprasegmental, recursos retóricos, uso de las funciones
comunicativas del lenguaje, ubicación de la base de la articulación y el
timbre, ratios elocutivos, etc.” Y no se debe olvidar de que la carga de la
prueba debe llevarla la acusación, de modo sistemático y con exhaustividad,
mientras que a la defensa le basta una duda razonable para conseguir que prevalezca
la presunción de inocencia. Sin embargo, en este caso, más que una duda, hay
una evidencia de que, aunque los tonos y timbres de voz, efectivamente, algo se
parecen (más aún si se han mutilado los armónicos por las grabaciones y
regrabaciones de conversaciones realizadas por teléfonos móviles GSM, y por lo
tanto digitalizadas perdiendo toda la calidad necesaria para diferenciarlas con
precisión), las voces son distintas, y bien diferenciables, si se escucha con
atención la pronunciación más o menos castellano-valenciana.
Obviamente,
esta evidencia no es igualmente percibida por unos oyentes que por otros, más
entrenados para la escucha de precisión, y sobre todo, por los que estén más
familiarizados con las diferencias entre el habla de los lugares de procedencia,
aprendizaje, formación y socialización de quienes hablan en cinta indubitada, y
en las dubitadas.
La
influencia del valenciano en el acusado es bastante obvia, pero lo que es muy
sospechoso es que el informe de la policía no haga la más mínima referencia a
esta realidad tan evidente, y que sin haberla notado pueda alguien atreverse a
manifestar que “Los resultados en esta
fase de estudio son de un alto nivel
de similitud entre ambas voces” cuando es más cierto lo contrario.
Sobre el estudio acústico sobre
representación gráfica de la señal
Lo que manifiesta el
informe de la policía, SIN APORTAR NI
UN SOLO GRÁFICO, podría decirse de cualquier otra identificación de
voces, y como no pueden verse los gráficos, bien podrían ser los mismos para todas
las identificaciones positivas. Ya se ha insistido en la extremada gravedad de
este sospechoso hecho. No soy capaz de comprender la motivación de la Sala para
denegar lo solicitado por este perito en mi escrito de 6 de abril de 2005 en el que
respetuosamente yo mismo pedía “toda
la información, infografía y descripción de los fundamentos tecnológicos en los
que se basa el autor en los folios 170 a 172, porque sólo ofrece
conclusiones y finalmente lo que aparenta ser una conclusión de conclusiones,
pero ni un solo gráfico,
medida, metrología, o evidencia técnica y todo ello hace imposible la
refutación pericial y queda en indefensión probatoria el presuntamente
identificado” y todavía peor es que la Sala haya considerado que “...no ha lugar a lo solicitado en cuanto a que se
faciliten al perito de su parte otros datos sobre los medios utilizados por la
policía científica ni darle acceso a ellos ni sobre los detalles gráficos que
recaba que no estén reflejados en el informe que está unido a los autos...”
y peor aún es que la Sala también considere que este perito de parte ha podido
elaborar este documento “en las mismas
condiciones que la policía científica en la elaboración del suyo”.
Como
perito, yo ya no tengo palabras para protestar y quejarme, más respetuosamente.
Pero
sí que las tengo para denunciar científicamente que el estudio acústico sobre
representación gráfica de la señal de la policía es cualquier cosa menos
repetible, en el sentido claramente manifestado por Bonastre et al. y por lo
que la Corte Suprema de los EEUU consideró como necesario para constituir
evidencia científica para uso judicial, repito, según la decisión del caso
“Daubert v. Merrell Dow Pharmaceuticals”, de 1993.
La
conclusión a la que la policía llega para mí vale, exactamente, lo mismo que
sus gráficos.
Sobre el “estudio fonoarticularorio”
El
párrafo introductorio del folio 171 es más de lo mismo. Vuelve a hacerse
referencia a unos gráficos que no se aportan, y a unas “características de alto valor identificativo o discriminatorio a nivel
individual en la fase productora del habla” que no se explicitan.
La
relación de fonemas /a/ en “mecánico” /i/ en “y le” parece estar elegida deforma caprichosa y en todo caso
injustificada, pero lo que es peor, las frecuencias de F2 y F3
no diferencian entre voz indubitada y dubitada y resultan completamente
inútiles para apreciar la amplitud y energía de cada fonema para comparar
similitudes o diferencias en el timbre de voz. Estas dos últimas observaciones
de la policía están completamente fuera de lugar, porque nada tienen que ver
con el estudio fonoarticulatorio. La “utilización
frecuente de la expresión {sabes} al final de la frase, tanto en indubitada
discurso libre como en dubitada” además de no ser relevante por lo
frecuente de su uso en muchísimos hablantes de cualquier lugar de España, casi
de cualquier tipo de formación, profesión y edad, resulta mucho más propia del
estudio de percepción auditiva, que del fonoarticulatorio propiamente dicho.
La
caracterización del “hablante con
peculiar tensión articulatoria, estructura de la señal y cadencia elocutiva”
sin precisar en qué consiste la peculiaridad, o cómo puede describirse la
estructura, o cómo es su cadencia elocutiva, vacía por completo cualquier
credibilidad que pudiera depositarse en estos estudios de la policía y recuerda
a las acusaciones mediante tautologías que, siendo completamente ciertas, nada
tienen que ver con el acusado. En este caso, la identificación se basa en
comparaciones o cotejos de voces cuyas procedencias (o al menos la localización
precisa entre los muchos minutos de grabaciones), evidencias, cuantificaciones
y representaciones gráficas son inaccesibles para el acusado, su defensa y su
perito.
A
este perito le gustaría saber cómo podría comprobar la policía científica que
es correcto este estudio fonoarticulatorio, para lo que tendría que volver a
escuchar los fonemas y a obtener los gráficos y medidas que el acusado, su
defensa y su perito no han podido escuchar porque no es posible saber de dónde
pueden ser escuchados, cómo se han medido (en Hz, dB, Fx y otras
magnitudes), y cómo se han comparado las medidas de las voces indubitada y
dubitadas.
Con
el único propósito de hacerme entender lo mejor posible en este importantísimo
punto, aún a riesgo de no ser bien comprendido, o sólo comprendido como yo
quisiera, voy a hacer una analogía con la pericia caligráfica de dos textos
manuscritos, con la diferencia de que uno, el indubitado, se ha escrito con pluma
estilográfica en un papel (micrófono directo), y el dubitado, se ha pintado con
brocha en una pared (móviles GSM en sistema SITEL). La comparación de uno y
otro sin tener en cuenta tamaños, grosores y puntas (pluma o brocha) con la que
se han hecho los trazos, es tan absurda como la que se pretende entre la
muestra de voz indubitada y las grabaciones de conversaciones telefónicas
intervenidas por orden judicial dubitadas. Y lo peor de todo es que ni siquiera
consta esta diferencia de calidad en el informe policial, y tampoco se hace
referencia a ningún procedimiento de homogeneización entre grabaciones directas
y telefónicas para poder hacer algún tipo de espectografía, que tampoco se
detalla ni ilustra.
Y sobre las referencias paramétricas
complementarias
Siguiendo
con la analogía anterior, tratar de medir, y más aún, de hacer estimaciones
estadísticas entre grafismos realizados con pluma con otros realizados con
brocha, es no tener ni idea de ciencias forenses en general, y tampoco de
acústica en particular. El mero hecho de que se utilicen grabaciones de un GSM
que utiliza algoritmos de comprensión digital que afectan a la señal mutilando
armónicos de manera no lineal, ni fácilmente analizable, y lo que es peor, el
que ni siquiera se mencione o se considere este hecho, descalifica por completo
a un informe así.
Aunque
espero y deseo que pueda ser aclarado en el juicio, parece como si se hubiera
utilizado un sistema automático, probablemente el KAY DSP 5500 para obtener
estas referencias paramétricas en las que una diferencia de 3,9 Hz (12,72-8,82)
es decir, de más de un 44%, se considera “normal”, en mi opinión, erróneamente.
Desde luego, con independencia de cuál sea la magnitud y el procedimiento de
estimación de esa desviación estándar, a mí, como perito, me parece muy
relevante, y es muy sospechoso que un 44% de diferencia entre cualquier valor
relevante, no sea bien explicado. Escucharemos muy atentamente esa explicación,
si la hay.
4.- Propuestas positivas para una mejor
identificación en situaciones similares
El
hecho notorio de que un criminalista esté en contra de que se pretenda dar
valor probatorio a lo que no deja, porque no puede dejar de ser un indicio, no
significa que no se considere importante la identificación por voz. Antes al
contrario, el conocimiento de sus limitaciones permite aprovechar mejor un
recurso fundamental para la investigación criminalística.
La
enorme cantidad de conversaciones grabadas por el Sistema Integrado de
Interceptación Telefónica (SITEL) y por otros similares de otros países hace necesaria la
automatización, que conlleva cierta objetivización del proceso de escucha e
identificación al depender más de sistemas informáticos que buscan y muestran
pautas en las voces de sospechosos o de criminales en búsqueda y captura que
deben de ser localizados por todos los medios posibles, incluido el rastreo y
cotejo de sus voces indubitadas con las de sospechosos que participan en
conversaciones intervenidas por orden judicial, en cualquier teléfono del
mundo.
Evidentemente,
todos los proyectos, y más aún los sistemas que están funcionando actualmente,
están protegidos por medidas de seguridad física, lógica y jurídica, por estar
oficialmente clasificados como materia reservada. Pero sabemos que sus
fundamentos tecnológicos e informáticos (inteligencia artificial y sistemas
expertos con avanzada heurística y hermenéutica), están principalmente basados
en estadística para contrastes y medida de “distancias fonéticas” en secuencias
de valores parametrizados teniendo muy en cuenta si la grabación es directa o
telefónica, y en cualquier caso, homegeneizando la representación de las voces
dubitadas e indubitadas. Sobre este tipo de sistemas y proyectos, sí existe
abundante literatura científica.
Sin
embargo, la subjetiva interpretación policial analizada y criticada aquí nos ha
llevado a reflexionar a varios estudiosos de la criminalística y la acústica
sobre lo que podría mejorar las actuales identificaciones de voz con los
recursos disponibles actualmente.
En
primer lugar, la toma de muestras indubitadas debería realizarse con los medios
más parecidos a los empleados en la grabación de las voces dubitadas, y
cuando éstas sean de teléfonos fijos o móviles, hacerlo también con teléfonos
fijos o móviles, iguales o similares.
En
segundo lugar, es absolutamente inaceptable que un único funcionario concluya
un informe inculpatorio sin ofrecer muchos más datos y gráficos que puedan ser
revisados, comprobados o recalculados por un perito contrario. Pero aunque se
proporcionasen todos los datos y gráficos, sería necesario demostrar capacidad
diferenciadora real emparejando, por ejemplo, una docena (o un número
suficiente) de voces que el acusado pudiera elegir como parecidas a la suya.
Finalmente,
en este caso, hemos experimentado con una muy curiosa capacidad del acusado
para diferenciar su propia voz de las muestras seleccionadas por este perito
transmitidas a través de un teléfono móvil. También su hijo ha acertado en la
diferenciación de la voz del acusado respecto de la del desconocido. Sin
embargo, algún conocido suyo se equivocó. Esta experiencia nos ha hecho pensar
en un procedimiento neutro, objetivo, y sistematizable con rigor científico por
el que el acusado podría reducir el valor probatorio de la identificación si él
mismo es capaz de diferenciar su propia voz indubitada, de las dubitadas. Sobre
este proyecto trataremos de trabajar en próximas fechas, y también en un muy
necesario “jurado pericial de voces”.
y 5.- C O N C L U S I O N E S
PRIMERA.-
Si la investigación policial y la instrucción judicial consideraron que en un
teléfono móvil se estaban produciendo conversaciones presuntamente delictivas,
antes de imputar penalmente lo más lógico sería intervenir ese número e
investigar antes de tratar de identificar pericialmente voces dubitadas. El no
haberlo hecho así tal vez tenga alguna justificación, que hasta ahora se ignora
por completo, pero en cualquier caso, ha provocado una necesidad de prueba
exculpatoria cuando sólo existen dudosos indicios.
SEGUNDA.-
Si la identificación por la voz fuera tan sistemáticamente eficaz como se
pretende, el fichero “LOCUPOL”
generado actualmente por el Sistema Integrado de Interceptación
Telefónica (SITEL) tendría una
eficacia y utilidad muy superior a la que se le reconoce actualmente, y que
según se ha podido apreciar, es manifiestamente mejorable. Pueden buscarse
casos de errores en ese fichero.
TERCERA- Solventes científicos de varios países
advierten, incluso las más cuidadosas identificaciones con las máximas
garantías científicas posibles de los más avanzados sistemas técnicos, y
recomiendan ser muy prudentes para evitar sobrevaloraciones judiciales. El Federal Bureau of Investigation (FBI) y el gobierno de
los EEUU han financiado investigaciones para mostrar y demostrar los límites de
las identificaciones realizadas con medios mucho mejores que los utilizados por
la policía española.
CUARTA- Son preocupantes las irresponsables
comparaciones entre muestras de voz tomadas directamente con micrófono
(indubitadas) y las “(re)grabadas” de teléfonos móviles intervenidos
judicialmente (dubitadas) en los que se realizan compresiones digitales que
mutilan armónicos imprescindibles para identificar con rigor diferentes timbres
son muy imprecisas. En este caso, la calidad de las muestras indubitada y
dubitadas es muy diferente, y hace muy difícil y compleja la comparación.
Además, este perito tiene la sospecha de que las cintas indubitadas son
regrabaciones incompletas.
QUINTA.- Los datos y gráficos utilizados por la
policía son desconocidos para este perito por una decisión de la Sala, que se
respeta, pero que no se comparte en absoluto. El análisis crítico de algunos
datos hace pensar que son inconsistentes, arbitrarios y en todo caso,
insuficientes. Por ejemplo, el que no se haga ninguna referencia concreta al
lugar de nacimiento o residencia del acusado, o a sus posibles influencias
idiomáticas, resta credibilidad a la identificación policial. Mediante la
escucha de ciertos fonogramas seleccionados de las cintas, pueden apreciarse
claras diferencias entre las voces.
SEXTA.- De los pocos datos concretos y relevantes,
llama poderosamente la atención una diferencia
de 3,9 Hz (12,72-8,82) es decir, de más de un 44%, que la policía considera
“normal” para la gran diferencia relativa de la desviación estándar medida por
la policía entre las dos voces. En opinión de este perito, este dato debería
ser explicado, y calculado de nuevo, porque demuestra por sí mismo que existe
una gran incertidumbre en la identificación, y muy poco control, ninguna
calibración comprobable, y nada parecido a los requerimientos de la metrología
legal, en el informe policial cuestionado.
Lo
que manifiesto que es mi leal saber y entender para el procedimiento judicial
en el que se me ha solicitado opinión, en Madrid, en mayo de 2005.
Fdo.: Miguel Ángel Gallardo Ortiz, en www.cita.es
Tel.: 914743809 y 619776475
Ingeniero Superior y Criminólogo, Diplomado en Altos
Estudios Internacionales
Perito judicial de parte con
Curriculum Vitae publicado en http://www.cita.es/conmigo
Ver http://www.cita.es/fonogramas
Versión completa con gráficos en http://www.cita.es/fonogramas/peritaje.pdf
Documento policial escaneado en http://www.cita.es/fonogramas/policia.pdf
©
2005 Cooperación Internacional en Tecnologías
Avanzadas (C.I.T.A.) SL, http://www.cita.es
© 2005 Miguel Ángel Gallardo Ortiz, con e-mail miguel@cita.es