Contenido e Identificación de Archivos
1. ¿Qué es un archivo?
Un archivo es simplemente una secuencia de bytes. Su nombre o extensión (como .pdf, .exe, .jpg) no garantiza su contenido real.
Por ejemplo, un archivo llamado documento.pdf podría no ser un PDF válido si sus bytes no cumplen con la estructura esperada.
Para inspeccionar los bytes de un archivo en Linux, se puede usar el comando hexdump -C, que muestra el offset, los bytes en hexadecimal y su equivalente en ASCII.
Ejemplo: un archivo PDF comienza con %PDF, lo que ayuda a identificarlo visualmente.

