Publikace detail

Mining corporate annual reports for intelligent detection of financial statement fraud - A comparative study of machine learning methods
Autoři: Hájek Petr | Henriques Roberto
Rok: 2017
Druh publikace: článek v odborném periodiku
Název zdroje: Knowledge-Based Systems
Název nakladatele: Elsevier Science BV
Místo vydání: Amsterdam
Strana od-do: 139-152
Tituly:
Jazyk Název Abstrakt Klíčová slova
eng Mining corporate annual reports for intelligent detection of financial statement fraud - A comparative study of machine learning methods Financial statement fraud has been serious concern for investors, audit firms, government regulators, and other capital market stakeholders. Intelligent financial statement fraud detection systems have therefore been developed to support decision-making of the stakeholders. Fraudulent misrepresentation of financial statements in managerial comments has been noticed in recent studies. As such, the purpose of this study was to examine whether an improved financial fraud detection system could be developed by combining specific features derived from financial information and managerial comments in corporate annual reports. To develop this system, we employed both intelligent feature selection and classification using a wide range of machine learning methods. We found that ensemble methods outperformed the remaining methods in terms of true positive rate (fraudulent firms correctly classified as fraudulent). In contrast, Bayesian belief networks (BBN) performed best on non-fraudulent firms (true negative rate). This finding is important because interpretable "green flag" values (for which fraud is likely absent) could be derived, providing potential decision support to auditors during client selection or audit planning. We also observe that both financial statements and text in annual reports can be utilised to detect non-fraudulent firms. However, non-annual report data (analysts' forecasts of revenues and earnings) are necessary to detect fraudulent firms. This finding has important implications for selecting variables when developing early warning systems of financial statement fraud. Annual reports; Financial statement fraud; Text mining; Feature selection; Machine learning
cze Dolování výročních zpráv podniků pro inteligentní detekci podvodů ve finančních výkazech - Srovnávací studie metod strojového učení Podvody ve finančních výkazech jsou důležité pro investory, auditorské firmy, regulátory a ostatní stakeholdery na kapitálových trzích. Pro podporu jejich rozhodování se proto vyvíjejí inteligentní detekční systémy. Podvodné zkreslení finančních výkazů v komentářích manažerů bylo použito v nedávných studiích. Cílem této studie bylo zkoumat, zda lze zvýšit přesnost detekčních systémů pomocí kombinace informace získané z finančních výkazů a z komentářů managementu ve výročních zprávách. K tomu jsme použili inteligentní selekci atributů a klasifikaci pomocí řady metod strojového učení. Zjistili jsme, že soubory metod jsou přesnější než zbývající metody co se týká přesnosti správně klasifikovaných podvodných firem. Naopak, Bayesovské sítě byly nejlepší na třídě firem bez zjištěného podvodu. To je důležité z toho důvodu, že tak lze získat srozumitelné hodnoty a nástroj na podporu rozhodování auditorům během výběru klienta a plánování auditu. K detekci firem bez podvodu lze použít jak finanční ukazatele, tak text ve výročních zprávách. K detekci podvodu je pak nutné použít data mimo výroční zprávy (předpovědi analytiků). To má důležité implikace pro selekci atributů při vývoji systémů včasného varování.