¡¡¡Muy buenas tardes a todos, espero puedan ayudarme!!!
Muchas veces, después de un proceso bioinformático obtenemos una gran cantidad de resultados. Estos resultados los llevamos a una hoja Excel para un mejor manejo. Además, no todos los resultados nos interesan, entonces necesitamos realizar una extracción de forma manual; pero esto es una pérdida de tiempo, cuando hablamos de una gran cantidad de datos (más o menos 1000).
Por ejemplo, supongamos que es una hoja Excel, cada columna significa un valor para cada individuo.
Using text Syntax Highlighting
A B C D
Nombre Apellido Numero Casilla
1. Manuel Ramirez 123 4
2. Hugo Valdivia 345 7
3. David Requena 567 8
4. Michael Torres 666 9
5. Hugo Valdivia 789 5
6. Hugo Valdivia 987 3
7. Roberto Lozano 434 1
8. Manuel Ramirez 654 2
Coloreado en 0.000 segundos, usando
GeSHi 1.0.8.4
Como verán, algunas veces se repite la primera columna pero los valores restantes son diferentes. Entonces, yendo al grano del asunto... quisiera poder utilizar un
script en Perl que me permita extraer las filas que se repitan en la primera columna manteniendo los resultados de las demás columnas, de la siguiente forma:
Using text Syntax Highlighting
Hugo Valdivia 345 7
Hugo Valdivia 789 5
Hugo Valdivia 987 3
Manuel Ramirez 123 4
Manuel Ramirez 654 2
Coloreado en 0.000 segundos, usando
GeSHi 1.0.8.4
¿Es posible? Se los agradecería ya que me ahorraría un montón de tiempo.
P.D. Es para una gran cantidad de datos, es decir puedo tener valores repetidos como los que no... ¿Tendría que eliminar los que no se repiten? ¡¡HELP!!