Public information services and documents should be accessible to the widest possible readership. In particular, information from these sources often takes the form of numerical expressions, which pose comprehension problems for many people, including people with disabilities, who are often also exposed to poverty, illiteracy, or lack of access to advanced technology. This paper presents an approach to treat numerical information in the text simplification process to make it more accessible. A generic model for automatic text simplification systems is presented, aimed at making documents more accessible to readers with cognitive disabilities. The proposed approach is validated with a real system to simplify numerical expressions in Spanish. This system is then evaluated and the results show that it is appropriate for the task at hand.
The actual instances described here as examples have been developed as plug-ins for GATE to take advantage of existing NLP tools.
The 15 pairs of sentences are presented in the “Appendix” at the end of the paper.
This research is funded by the Spanish Ministry of Education and Science (TIN2009-14659-C03-01 Project), and the FPI grant program. The authors would like to thank Ricardo García for his help in this work.
This Appendix contains the 15 pairs of sentences selected to the survey carried out. In each question, the sentence tagged as (A) is the original and the sentence tagged as (B) is the simplified version.
Question 1
(A) El secretario general de la ONU, Ban Ki-moon, afirma que alrededor de 1.750 millones de personas de 104 países pobres no pueden satisfacer algunas de sus necesidades básicas.
(B) El secretario general de la ONU, Ban Ki-moon, afirma que casi 2000 millones de personas de más de 100 países pobres no pueden satisfacer algunas de sus necesidades básicas.
Question 2
(A) El Alto Comisionado de Naciones Unidas para los refugiados, Antonio Guterres, hizo un llamamiento a la comunidad internacional de unos 280 millones de dólares (205 millones de euros) para las 40 organizaciones que apoyan a los refugiados iraquíes en 12 países.
(B) El Alto Comisionado de Naciones Unidas para los refugiados, Antonio Guterres, hizo un llamamiento a la comunidad internacional de casi 300 millones de dólares (más de 200 millones de euros) para las unas 40 organizaciones que apoyan a los refugiados iraquíes en más de 10 países.
Question 3
(A) Con cerca de 76.000 visitantes profesionales procedentes de 115 países y más de 2.600 exhibidores, se trata de el certamen de referencia para este sector, en el que se presentan las novedades del juguete tradicional para el año 2011, según informó la Asociación Española de Fabricantes de Juguetes.
(B) Con casi 80000 visitantes profesionales procedentes de más de 100 países y casi 3000 exhibidores, se trata del certamen de referencia para este sector, en el que se presentan las novedades del juguete tradicional para el año 2011, según informó la Asociación Española de Fabricantes de Juguetes.
Question 4
(A) Por comunidades, destaca la representación de empresas de la Comunidad Valenciana con 55 participantes seguida de Cataluña con 29.
(B) Por comunidades, destaca la representación de empresas de la Comunidad Valenciana con casi 60 participantes seguida de Cataluña con casi 30.
Question 5
(A) Según la Comunidad, este proyecto se dirige a los autóctonos y a los más de un millón cien mil inmigrantes que viven en la región, de los que cerca de 34.000 proceden de Bulgaria.
(B) Según la Comunidad, este proyecto se dirige a los autóctonos y a los más de 1000000 inmigrantes que viven en la región, de los que más de 30000 proceden de Bulgaria.
Question 6
(A) Aproximadamente siete de cada diez prefiere el formato papel y el 13 % se decanta por un diario “on-line.”
(B) Aproximadamente siete de cada diez prefiere el formato papel y más de 10 % se decanta por un diario “on-line.”
Question 7
(A) Los filmes extranjeros no se libraron de la merma y atrajeron a un millón y medio menos de aficionados: 43,7 millones en lugar de los 45,3 millones del periodo anterior.
(B) Los filmes extranjeros no se libraron de la merma y atrajeron a 1500000 menos de aficionados: casi 44 millones en lugar de los más de 45 millones del periodo anterior.
Question 8
(A) Pinturas, esculturas y cerámicas de diferentes periodos y estilos del artista conforman este conjunto de 43 piezas cedidas en comodato por 15 años por la citada fundación.
(B) Pinturas, esculturas y cerámicas de diferentes periodos y estilos del artista conforman este conjunto de más de 40 piezas cedidas en comodato por casi 20 años por la citada fundación.
Question 9
(A) Según dicho trabajo, el hallazgo tuvo lugar en la nebulosa del Cangrejo, situada a 6.300 años luz de la Vía Láctea, en la constelación de Tauro y en la Vía Láctea.
(B) Según dicho trabajo, el hallazgo tuvo lugar en la nebulosa del Cangrejo, situada a más de 6000 años luz de la Vía Láctea, en la constelación de Tauro y en la Vía Láctea.
Question 10
(A) El fomento del conocimiento de la cultura y las lenguas españolas es una de las prioridades del departamento de Exteriores que aporta al Instituto Cervantes 86 de los 102 millones de euros de su presupuesto anual.
(B) El fomento del conocimiento de la cultura y las lenguas españolas es una de las prioridades del departamento de Exteriores que aporta al Instituto Cervantes casi 90 de los más de 100 millones de euros de su presupuesto anual.
Question 11
(A) El 61 % de los españoles de entre 12 y 18 años consumen habitualmente bebidas alcohólicas y de ellos el 10 % lo hacen para “colocarse.”
(B) Más de 60 % de los españoles de entre más de 10 y casi 20 años consumen habitualmente bebidas alcohólicas y de ellos 10 % lo hacen para “colocarse.”
Question 12
(A) Por otro lado, la ONU ha logrado recaudar un 34 % de los 2.000 millones de dólares (cerca de 1.400 millones de euros) solicitados como llamamiento de urgencia ante la catástrofe de Pakistán.
(B) Por otro lado, la ONU ha logrado recaudar más de 30 % de los 2000 millones de dólares (más de 1000 millones de euros) solicitados como llamamiento de urgencia ante la catástrofe de Pakistán.
Question 13
(A) Alrededor de 390.000 personas han regresado a sus casas desde que vieran obligadas a desplazar se por las inundaciones…
(B) Casi 400000 personas han regresado a sus casas desde que vieran obligadas a desplazar se por las inundaciones…
Question 14
(A) El 18,55 % de las agresiones que sufrieron los médicos españoles en sus consultas el año pasado tuvieron como consecuencia una lesión…
(B) Casi 19 % de las agresiones que sufrieron los médicos españoles en sus consultas el año pasado tuvieron como consecuencia una lesión…
Question 15
(A) En virtud de estas cifras, difundidas este martes en rueda de prensa, en 2010 se registraron en España un total de 451 agresiones a facultativos, es decir, 2,07 por cada mil médicos, lo que supone, a juicio de la organización médica, un “grave problema social” para el que se pide “tolerancia cero” y que se produce en el 90,63 % de los casos en el sector público.
(B) En virtud de estas cifras, difundidas este martes en rueda de prensa, en 2010 se registraron en España un total de casi 500 agresiones a facultativos, es decir, más de 2 por cada 1000 médicos, lo que supone, a juicio de la organización médica, un “grave problema social” para el que se pide “tolerancia cero” y que se produce en casi 91 % de los casos en el sector público.
