{"id":2261,"date":"2020-09-16T08:29:02","date_gmt":"2020-09-16T08:29:02","guid":{"rendered":"https:\/\/seguridadsispe.com\/?p=2261"},"modified":"2024-01-10T19:48:06","modified_gmt":"2024-01-10T19:48:06","slug":"big-data-y-data-science-cual-es-la-diferencia","status":"publish","type":"post","link":"https:\/\/seguridadsispe.com\/?p=2261","title":{"rendered":"Big Data y Data Science: \u00bfCu\u00e1l es la diferencia?"},"content":{"rendered":"<p>Consideramos, pues, que el objetivo de este an\u00e1lisis documental se ha cumplido, en tanto era proporcionar una selecci\u00f3n de textos que diera cuenta del an\u00e1lisis de grandes c\u00famulos de datos en relaci\u00f3n con los derechos humanos en general y no solo respecto a la tem\u00e1tica de la protecci\u00f3n de datos y la privacidad. La meta de la b\u00fasqueda de fuentes documentales para dar cuenta de la literatura que  existe sobre el tema se complet\u00f3 al identificar el criterio del an\u00e1lisis de grandes c\u00famulos de datos, tambi\u00e9n conocido como big data analytics, y el concepto de los derechos humanos relacionado al big data. Metcalf y Crawford, por su parte, resaltan los riesgos en el uso <a href=\"https:\/\/www.adiario.mx\/tecnologia\/el-bootcamp-de-tripleten-unico-por-su-metodo-de-ensenanza-y-plan-de-carrera\/\">https:\/\/www.adiario.mx\/tecnologia\/el-bootcamp-de-tripleten-unico-por-su-metodo-de-ensenanza-y-plan-de-carrera\/<\/a> del big data al mencionar que la serie de datos que se presentan en los resultados de investigaciones cient\u00edficas, sean estos parciales o finales, parecer\u00eda tener un m\u00ednimo de riesgo al ser compartidos. En ese sentido, sostienen que no se contempla el riesgo para los derechos humanos, situaci\u00f3n que explican como resultado de una mala interpretaci\u00f3n, ya que la publicidad de estos datos que se ponen a disposici\u00f3n de manera abierta puede derivar en muchas ocasiones en que se les d\u00e9 un uso secundario muy distinto al de la investigaci\u00f3n; y que, al combinarlos con otra base de datos, eso puede colocar en situaci\u00f3n comprometida a los due\u00f1os de dicha informaci\u00f3n.<\/p>\n<p>Con el uso de tecnolog\u00edas disruptivas como la inteligencia artificial y el Big Data se espera estar mejor preparados para una pr\u00f3xima pandemia, incluso prevenirla. Tecnolog\u00edas 4.0 como el internet de las cosas, la computaci\u00f3n inteligente y la computaci\u00f3n en la nube aportar\u00e1n lo suyo en cuanto al monitoreo permanente de las ciudades en busca de anomal\u00edas biol\u00f3gicas y qu\u00edmicas que impliquen alg\u00fan riesgo para la sociedad o el medio ambiente. Este tipo de desarrollos pueden ser personalizados, pues al aplicar algoritmos de aprendizaje predictivo se minimizan los riesgos al formular tratamientos que pueden establecer si un paciente los tolera o no. Con base en lo anterior, el estudio del COVID-19 empleando Big Data puede valerse de la anal\u00edtica retrospectiva y descriptiva avanzadas (Mohamed et al., 2019) expresas en la inteligencia de negocios (Business intelligence) (Chahal, Jyoti y Wirtz, 2019); ya que esta permite focalizar el estudio mediante indicadores y tendencias en el tiempo, lo que incluye predicciones a futuro. Bajo estos criterios, entra a formar parte la ciencia de datos empleando t\u00e9cnicas estad\u00edsticas y matem\u00e1ticas caracterizadas en las variables de estudio que permiten ampliar las t\u00e9cnicas y modelos representados como clusters (Mohebi et al., 2016) a trav\u00e9s de patrones o correlaciones de datos, que a la vez pueden ser integrados  con la IA para mejorar los resultados. El Big Data se entiende como el conjunto de procedimientos computacionales aplicados para analizar gran cantidad de datos con el fin de extraer informaci\u00f3n que presente ciertos patrones, relaciones y asociaciones relevantes para una organizaci\u00f3n.<\/p>\n<h2>Informaci\u00f3n<\/h2>\n<p>La IA en conjunto con el Big Data han demostrado ser herramientas fundamentales para ayudar al sector salud a detectar y controlar este virus con cierto margen de \u00e9xito, permitiendo procesar grandes cantidades de datos estructurados y no estructurados con alto grado de complejidad, que al ser combinados con algoritmos propios de la IA permiten realizar predicciones basado en patrones hist\u00f3ricos y bucles de retroalimentaci\u00f3n, entre otros. Lo importante de esta sinergia, es que ayuda de manera m\u00e1s eficaz a la atenci\u00f3n m\u00e9dica, incluso una vez terminada la crisis. Tambi\u00e9n, con el aprendizaje que se est\u00e1 gestando permanentemente ya hay desarrollos de algoritmos predictivos que permiten identificar poblaciones que son o ser\u00e1n m\u00e1s propensas a ser infectadas por la COVID-19, incluso determinar en t\u00e9rminos probabil\u00edsticos quienes podr\u00e1n padecer complicaciones graves con base en par\u00e1metros como edad, g\u00e9nero, historial cl\u00ednico, masa corporal, entre otros. Con este tipo de desarrollo, estos algoritmos pueden extenderse a ser aplicados a otro tipo de enfermedades, contribuyendo de esta manera a mejorar el servicio sanitario. El reconocimiento de patrones (Pattern Recognition) es una t\u00e9cnica que se aplica principalmente en procesos de ingenier\u00eda, computaci\u00f3n y matem\u00e1ticas que tiene como objetivo extraer informaci\u00f3n, a partir de un c\u00famulo de datos, que brinde la posibilidad de establecer propiedades o relaciones entre estos datos.<\/p>\n<div style='text-align:center'><iframe width='561' height='319' src='https:\/\/www.youtube.com\/embed\/JK2MdJAWEGc' frameborder='0' alt='articulos cientificos de big data' allowfullscreen><\/iframe><\/div>\n<p>Es necesario optimizar los recursos de red cuando se trabaja con Map Reduce, por ello es bueno leer los datos desde discos locales y reducir la cantidad de datos enviados a trav\u00e9s de la red. Las consecuencias del procesamiento de datos ya no se limitan a los conocidos problemas relacionados con la privacidad, sino que abarcan los prejuicios contra grupos de individuos y una gama m\u00e1s amplia de derechos fundamentales. La tensi\u00f3n entre el uso m\u00e1s extendido del Big Data y la Inteligencia Artificial por un lado, y la creciente demanda de uso de datos \u00e9tico y socialmente responsable por el otro, revela la falta de un marco regulatorio que pueda abordar los problemas sociales planteados por estas tecnolog\u00edas (Mantelero, 2018, p. 771). El concepto de derechos humanos es uno que se acu\u00f1a posteriormente a la Segunda Guerra Mundial, pues los individuos se vuelven sujetos de derecho internacional tras el juicio de diversos personajes en el Tribunal de N\u00faremberg.<\/p>\n<h2>Diferencias entre big data y data science<\/h2>\n<p>Si se pierde de vista esto, se crea una mala interpretaci\u00f3n potencial o, peor a\u00fan, una manipulaci\u00f3n que puede fallar en proteger a las poblaciones vulnerables (Sarfaty, 2018, p. 849). Frente a la evoluci\u00f3n de los datos, la calidad de los mismos es fundamental ante la rapidez con que se generan, el procesamiento de la informaci\u00f3n, el incremento en la capacidad de almacenamiento y la posibilidad de realizar an\u00e1lisis m\u00e1s complejos. Desde el 2007, cuando comenz\u00f3 a popularizarse<br \/>\n\t\t\t\tla web 2.0, se ha ido produciendo la transformaci\u00f3n, si bien vertiginosamente pero<br \/>\n\t\t\t\tde forma paulatina y a\u00fan, hoy en d\u00eda, se sigue desarrollando.<\/p>\n<ul>\n<li>La pediatr\u00eda no est\u00e1 ajena a esta realidad, pues cada vez se emplean tecnolog\u00edas m\u00e1s avanzadas que est\u00e1n generando grandes vol\u00famenes de datos, los cuales impactar\u00e1n en la forma en que se conduzcan las in vestigaciones en el futuro inmediato.<\/li>\n<li>Es imprescindible que sepan que tienen derecho a que sus datos sean confidenciales y a decidir si se utilizan para an\u00e1lisis o publicaci\u00f3n en otros entornos\u201d, alerta la investigadora.<\/li>\n<li>En pocas palabras, se\u00f1ala Walter Sosa \u201cbig data le permite a la estad\u00edstica liberarse de su mero rol de estimar los modelos que otra disciplina le propone, y pasa a asumir la tarea de construirlos, evaluarlos y redise\u00f1arlos, a trav\u00e9s de la conjunci\u00f3n de algoritmos y datos masivos\u201d (p. 40).<\/li>\n<li>Map Reduce [8] es un modelo de programaci\u00f3n asociado a las implementaciones que requieren procesamiento y generaci\u00f3n de grandes bases de datos.<\/li>\n<\/ul>\n<p>El crecimiento en el uso de Internet y la aparici\u00f3n de las redes sociales ha provocado que en<br \/>\n\t\t\t\tdiferentes casos la informaci\u00f3n llegue antes al \u00e1mbito del periodismo ciudadano que<br \/>\n\t\t\t\ta los grandes medios de comunicaci\u00f3n. Marcos Recio<br \/>\n\t\t\t\t\t(2014) plantea una relegaci\u00f3n de la primicia porque, cada vez con m\u00e1s<br \/>\n\t\t\t\tfrecuencia, la noticia es captada antes por el lector a trav\u00e9s de redes sociales tan<br \/>\n\t\t\t\tpopulares como Twitter y Facebook. Incluso esta \u00faltima genera, a trav\u00e9s de FB<br \/>\n\t\t\t\tNewswire, su propio archivo de informaciones al que recurren frecuentemente los<br \/>\n\t\t\t\tmedios de comunicaci\u00f3n, lo que ha convertido a esta red social en una fuente<br \/>\n\t\t\t\tprimaria de noticias (Mitchell, 2014). Independientemente de la denominaci\u00f3n, una sociedad en la que aumenta la informaci\u00f3n y en la que crece la necesidad de transparencia se postula como el marco ideal para que los periodistas utilicen y expliquen los datos, aunque sean complejos, por t\u00e9cnicas como la visualizaci\u00f3n. En el momento actual, en muchos pa\u00edses se est\u00e1 expandiendo el t\u00e9rmino periodismo de datos, que sugiere una forma especializada de recogida y an\u00e1lisis de datos en la l\u00ednea del trabajo realizado por analistas o investigadores, en donde el componente inform\u00e1tico es una parte central de la elaboraci\u00f3n, en ocasiones automatizada, de la producci\u00f3n de noticias.<\/p>\n<h2>Roberto Alejandro L\u00f3pez-Novelo, Dr., Universidad An\u00e1huac M\u00e9xico<\/h2>\n<p>A ello se a\u00f1ade un cambio en las<br \/>\n\t\t\t\trutinas profesionales que desembocan, seg\u00fan Paulussen y Harder (2014), en la navegaci\u00f3n diaria de los periodistas<br \/>\n\t\t\t\tpor las redes sociales en la b\u00fasqueda de informaciones o para no quedarse rezagados<br \/>\n\t\t\t\ten la difusi\u00f3n de los hechos. De hecho, un estudio de Pew Research (2012) concluye que el 39 % de los videos sobre<br \/>\n\t\t\t\tacontecimientos inesperados que fueron difundidos <a href=\"https:\/\/www.adiario.mx\/tecnologia\/el-bootcamp-de-tripleten-unico-por-su-metodo-de-ensenanza-y-plan-de-carrera\/\">bootcamp de programaci\u00f3n<\/a> por medios de comunicaci\u00f3n hab\u00edan<br \/>\n\t\t\t\tsido grabados por los ciudadanos. Por un lado, al hablar de datos en abierto se conectar\u00eda con todas la opciones que existen para la recopilaci\u00f3n, tratamiento, reutilizaci\u00f3n y difusi\u00f3n de los datos sin restricciones. En efecto, esta idea estar\u00eda relacionada con todos aquellos que apoyan el libre acceso al conocimiento, a los programas inform\u00e1ticos, etc.<\/p>\n<ul>\n<li>As\u00ed se dio el comienzo de una sociedad hiperconectada que genera datos a cada segundo, generando la materia prima de los an\u00e1lisis de grandes vol\u00famenes de datos que utilizan desde el reconocimiento facial, la geolocalizaci\u00f3n y los estados de \u00e1nimo hasta el historial de sitos frecuentados, los gustos gastron\u00f3micos y el nivel de gastos, entre muchos otros indicadores.<\/li>\n<li>Este tipo de desarrollos pueden ser personalizados, pues al aplicar algoritmos de aprendizaje predictivo se minimizan los riesgos al formular tratamientos que pueden establecer si un paciente los tolera o no.<\/li>\n<li>En este contexto,<br \/>\n\t\t\t\t\tPeset, Ferrer-Sapena y Subirats-Coll<br \/>\n\t\t\t\t\t(2011) plantean el open data como una eficaz v\u00eda para<br \/>\n\t\t\t\tdetectar duplicados documentales, eliminar las posibles ambig\u00fcedades terminol\u00f3gicas<br \/>\n\t\t\t\ty suministrar la informaci\u00f3n y datos a usuarios de otras especialidades<br \/>\n\t\t\t\tprofesionales, como es el caso particular de los periodistas.<\/li>\n<li>Estos pueden regis trar informaci\u00f3n de posici\u00f3n geogr\u00e1fica, variaciones atmosf\u00e9ricas, cambio de temperatura, velocidad de movimiento, entre muchos otros12.<\/li>\n<li>Partiendo de la necesidad de almacenamiento y an\u00e1lisis de los datos se desarrolla el ecosistema Hadoop, los sistemas de archivos distribuidos, el desarrollo de aplicaciones con MapReduce, el lenguaje de consultas Hive y otras herramientas como HBase, ZooKeeper y Sqoop.<\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Consideramos, pues, que el objetivo de este an\u00e1lisis documental se ha cumplido, en tanto era proporcionar una selecci\u00f3n de textos que [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[102],"tags":[],"class_list":["post-2261","post","type-post","status-publish","format-standard","hentry","category-bootcamp-de-programacion"],"_links":{"self":[{"href":"https:\/\/seguridadsispe.com\/index.php?rest_route=\/wp\/v2\/posts\/2261","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/seguridadsispe.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/seguridadsispe.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/seguridadsispe.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/seguridadsispe.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=2261"}],"version-history":[{"count":1,"href":"https:\/\/seguridadsispe.com\/index.php?rest_route=\/wp\/v2\/posts\/2261\/revisions"}],"predecessor-version":[{"id":2262,"href":"https:\/\/seguridadsispe.com\/index.php?rest_route=\/wp\/v2\/posts\/2261\/revisions\/2262"}],"wp:attachment":[{"href":"https:\/\/seguridadsispe.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=2261"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/seguridadsispe.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=2261"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/seguridadsispe.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=2261"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}