Normalmente usaría collapseReplicates
(o colapsar aguas arriba) para manejar las réplicas técnicas.
Sin embargo, en mi diseño experimental actual de RNA-seq, las muestras se secuenciaron dos veces el uso de diferentes protocolos de preparación de bibliotecas, lo que lleva a marcadas diferencias en las estimaciones de recuento resultantes (de hecho, la elección de un protocolo diferente explica la mayor parte de la variación en los datos masivos según PCA). Por lo tanto, me gustaría modelar estas diferencias agregándolas como una covariable al modelo DESeq2.
Yo pensé que podría simplemente agregar otro factor a la fórmula de diseño, equivalente a el ejemplo "pasilla" en la viñeta DESeq2, que agrega el factor type
para el tipo de biblioteca (single-end vs paired-end). Sin embargo, la viñeta pasilla establece que estas diferentes bibliotecas son en realidad réplicas biológicas independientes, no réplicas técnicas como había asumido anteriormente.
Ahora estoy preocupado de que tener réplicas técnicas en el diseño pudiera inflar artificialmente la potencia. ¿Se puede salvar el diseño?
Vale la pena señalar que también tenemos réplicas biológicas y un diseño de rango completo; es decir, cada combinación de tratamiento y preparación de la biblioteca, con réplicas biológicas.