Department of Information Technology Faculty Publications

Scalable Multipartite Subgraph Enumeration for Integrative Analysis of Heterogeneous Experimental Functional Genomics Data

Charles A. Phillips, University of Tennessee, KnoxvilleFollow
Kai Wang, Georgia Southern UniversityFollow
Jason Bubier, The Jackson Laboratory, Bar Harbor, ME
Erich J. Baker, Baylor University
Elissa J. Chesler, The Jackson Laboratory, Bar Harbor, ME
Michael A. Langston, University of Tennessee, KnoxvilleFollow

Document Type

Contribution to Book

Publication Date

9-12-2015

Publication Title

Proceedings of the ACM Conference on Bioinformatics, Computational Biology and Health Informatics

DOI

10.1145/2808719.2812595

ISBN

978-1-4503-3853-0

Abstract

Functional genomics, the effort to understand the role of genomic elements in biological processes, has led to an avalanche of diverse experimental and semantic information defining associations between genes and various biological concepts across species and experimental paradigms. Integrating this rapidly expanding wealth of heterogeneous data, and finding consensus among so many diverse sources for specific research questions, require highly sophisticated big data structures and algorithms for harmonization and scalable analysis. In this context, multipartite graphs can often serve as useful structures for representing questions about the role of genes in multiple, frequently-occurring disease processes. The main focus of this paper is on finding and analyzing efficient algorithms for dense subgraph enumeration in such graphs. An O(3^n/3)-time procedure was devised to enumerate all maximal k-partite cliques in a k-partite graph, where k ≥ 3. The maximum number of such cliques is also shown to obey this bound, and thus this procedure obtains the best possible asymptotic performance. Empirical testing on both real and synthetic data is conducted. Concrete applications to biological data are described, as are scalability issues in the context of big data analysis.

Recommended Citation

Phillips, Charles A., Kai Wang, Jason Bubier, Erich J. Baker, Elissa J. Chesler, Michael A. Langston. 2015. "Scalable Multipartite Subgraph Enumeration for Integrative Analysis of Heterogeneous Experimental Functional Genomics Data." Proceedings of the ACM Conference on Bioinformatics, Computational Biology and Health Informatics: 626-633 Atlanta, GA: Association for Computing Machinery. doi: 10.1145/2808719.2812595 source: https://dl.acm.org/citation.cfm?doid=2808719.2812595 isbn: 978-1-4503-3853-0
https://digitalcommons.georgiasouthern.edu/information-tech-facpubs/56

Link to Full Text

COinS

Department of Information Technology Faculty Publications

Scalable Multipartite Subgraph Enumeration for Integrative Analysis of Heterogeneous Experimental Functional Genomics Data

Document Type

Publication Date

Publication Title

DOI

ISBN

Abstract

Recommended Citation

Search Digital Commons

Browse Digital Commons

About Digital Commons

Links

Department of Information Technology Faculty Publications

Scalable Multipartite Subgraph Enumeration for Integrative Analysis of Heterogeneous Experimental Functional Genomics Data

Authors

Document Type

Publication Date

Publication Title

DOI

ISBN

Abstract

Recommended Citation

Share

Search Digital Commons

Browse Digital Commons

About Digital Commons

Links