Eliminar datos redundantes de una tabla
Publicado: 2016-03-16 04:05 @211
Buenos días.
Aquí sigo con tablas y problemas derivados. Necesito "filtrar" una tabla (texto separado por tabuladores) con miles de filas y decenas de columnas en la que todos los valores de la columna 1 pueden aparecer repetidos en varias filas, y la intención es eliminar esas filas donde se produzca la repetición.
Había pensado en una estructura tipo Hash of Arrays, en la que si la primera columna actúa como referencia para el filtrado. Así, el valor de la primera columna se va introduciendo como clave y luego se busca en los arrays (valores del hash) de las siguientes líneas, y si se encuentra, se elimina esa línea.
Ejemplo reducido de tabla:
No puedo poner un código de muestra, porque como todos me funcionan tan rematadamente mal, prefiero no interferir con un programa que no sirve...
Aquí sigo con tablas y problemas derivados. Necesito "filtrar" una tabla (texto separado por tabuladores) con miles de filas y decenas de columnas en la que todos los valores de la columna 1 pueden aparecer repetidos en varias filas, y la intención es eliminar esas filas donde se produzca la repetición.
Había pensado en una estructura tipo Hash of Arrays, en la que si la primera columna actúa como referencia para el filtrado. Así, el valor de la primera columna se va introduciendo como clave y luego se busca en los arrays (valores del hash) de las siguientes líneas, y si se encuentra, se elimina esa línea.
Ejemplo reducido de tabla:
Using text Syntax Highlighting
A_clavatus_280 A_clavatus_280 A_flavus_132 None None T_verrucosum_99
A_flavus_413 A_clavatus_280 A_flavus_413 None None T_verrucosum_99
C_dubliniensis_121 None None C_dubliniensis_121 S_schenckii_304 None
C_dubliniensis_11 None None C_dubliniensis_121 S_schenckii_304 None
S_schenckii_70 A_clavatus_20 A_flavus_132 None S_schenckii_70 T_verrucosum_110
T_verrucosum_14 A_clavatus_251 A_flavus_108 None S_schenckii_228 T_verrucosum_14
C_dubliniensis_111 None None C_dubliniensis_121 None None
A_flavus_413 A_clavatus_280 A_flavus_413 None None T_verrucosum_99
C_dubliniensis_121 None None C_dubliniensis_121 S_schenckii_304 None
C_dubliniensis_11 None None C_dubliniensis_121 S_schenckii_304 None
S_schenckii_70 A_clavatus_20 A_flavus_132 None S_schenckii_70 T_verrucosum_110
T_verrucosum_14 A_clavatus_251 A_flavus_108 None S_schenckii_228 T_verrucosum_14
C_dubliniensis_111 None None C_dubliniensis_121 None None
Coloreado en 0.000 segundos, usando GeSHi 1.0.8.4
No puedo poner un código de muestra, porque como todos me funcionan tan rematadamente mal, prefiero no interferir con un programa que no sirve...