Ενδιάμεσα αποτελέσματα
Η Επιτροπή Ανταγωνισμού (ΕΑ), στο πλαίσιο των αρμοδιοτήτων της και προκειμένου να ερευνηθεί εάν συντρέχουν οι προϋποθέσεις εκκίνησης αυτεπάγγελτης έρευνας για τυχόν παράβαση των διατάξεων του ν. 3959/2011 ή/και 101 και 102 ΣΛΕΕ στους δημόσιους διαγωνισμούς προμήθειας, διεξήγαγε έρευνα στις αγορές α) αναγκαίου υγειονομικού υλικού, β) κάθε ενδεδειγμένου μέσου ατομικής ή συλλογικής προστασίας από τη διάδοση του κορωνοϊού και γ) ειδικού νοσοκομειακού εξοπλισμού για θεραπεία και νοσηλεία κρουσμάτων κορωνοϊού, αξιολογώντας στοιχεία προμηθειών πριν και μετά την εφαρμογή της υπ’ αριθ. ΠΝΠ Α΄42/25.2.2020, του άρθρου 19 του ν. 4675/2020 και της υπ’ αριθ. 19012/17.3.2020 ερμηνευτικής εγκυκλίου. Σκοπός της προκαταρκτικής αυτής έρευνας είναι ο προσδιορισμός των εταιρειών εκείνων που εν μέσω της υγειονομικής κρίσης του COVID-19 στην Ελλάδα προέβησαν σε υπερτιμολογήσεις. Η ενέργεια αυτή κρίθηκε απαραίτητη ως αποτέλεσμα της κατακόρυφης αύξησης της ζήτησης του εν λόγω υγειονομικού και ιατρικού εξοπλισμού καθώς και της ανάγκης άμεσης προμήθειας των συγκεκριμένων προϊόντων κατά παρέκκλιση των τυπικών διαγωνιστικών διαδικασιών, γεγονός το οποίο ενδέχεται να οδήγησε σε αυξημένες τιμές προερχόμενες από πρακτικές επιχειρήσεων στην αλυσίδα διανομής που δύνανται να εμπίπτουν στις διατάξεις του ν. 3959/2011.
Σχετικές εκτεταμένες έρευνες έχουν πραγματοποιηθεί από την ΕΑ σε όλη την αλυσίδα διανομής υγειονομικού υλικού (γάντια, μάσκες μιας χρήσης και αντισηπτικά, βλ. σχετικά δελτία τύπου για την έναρξη της έρευνας και τα πρώτα συμπεράσματα) καθώς και σε συγκεκριμένες αγορές τροφίμων (βλ. σχετικά δελτία τύπου για την έναρξη αυτεπάγγελτων ερευνών σε διάφορες κατηγορίες τροφίμων και τα πρώτα συμπεράσματα καθώς και τον επιτόπιο έλεγχο στην αγορά των εσπεριδοειδών) κατά την περίοδο της υγειονομικής κρίσης του COVID-19 στην Ελλάδα.
Η έρευνα βασίστηκε σε δύο πηγές δεδομένων ήτοι σε στοιχεία που συλλέχθηκαν από την ΕΑ από τις επτά (7) Υγειονομικές Περιφέρειες της χώρας και σε δεδομένα από την ανοιχτή πλατφόρμα δημοσίων συμβάσεων “Diavgeia.gov.gr”.
Ειδικότερα, στις 16.4.2020 και στη συνέχεια με συμπληρωματική επιστολή στις 23.4.2020, η ΕΑ έστειλε επιστολές παροχής στοιχείων στις Υγειονομικές Περιφέρειες της χώρας, από τις οποίες ζητήθηκαν στοιχεία προμήθειας υγειονομικού υλικού (χειρουργικές μάσκες, μάσκες FFP2/FFP3, αντισηπτικά, οινόπνευμα, γάντια μιας χρήσης, στολές προστασίας TYVEC, προστατευτικά ματιών, γυαλιά προστασίας, ασπίδες προστασίας, απολυμαντικά δισκία, θερμόμετρα, ροόμετρα κλπ) για το διάστημα από το Νοέμβριο 2019 έως και το Μάρτιο 2020, καθώς και κατά τους μήνες Νοέμβριο 2019 έως και πριν την λήψη των έκτακτων μέτρων αντιμετώπισης του COVID-19. Τα στοιχεία περιέχουν πληροφορίες για κάθε προμήθεια αναφορικά με τον φορέα ανάθεσης, το προϊόν αγοράς, όλους τους προμηθευτές που υπέβαλλαν προσφορές καθώς και τον μειοδότη, την τιμή ανά μονάδα προϊόντος, τον τύπο της διαδικασίας προμήθειας (απευθείας ανάθεση, πρόχειρος μειοδοτικός διαγωνισμός, προσκλήσεις για συνοπτικούς διαγωνισμούς κα), το κριτήριο κατακύρωσης και την ημερομηνία υπογραφής της σύμβασης. Από το σύνολο των στοιχείων επιλέχθηκαν 12 προϊόντα για τα οποία υπήρξαν πολλές παρατηρήσεις και έγινε επεξεργασία του δείγματος παραλείποντας εκείνες τις παρατηρήσεις από τις οποίες έλειπαν στοιχεία για βασικές μεταβλητές. Οι παρατηρήσεις που χρησιμοποιήθηκαν για περαιτέρω ανάλυση από τη συλλογή των δεδομένων ανήλθαν σε 808.
Τα δεδομένα από τη ΔΙΑΥΓΕΙΑ συλλέχθηκαν μέσω της ανάπτυξης αλγορίθμων (χρήση Application Programming Interface - API), σε τρία βασικά βήματα, καθώς η ταχύτητα, ο όγκος και η ποικιλία της δομής και της φύσης των πληροφοριών που ανταλλάσσονται απαιτεί ειδική τεχνολογία και αναλυτικές μεθόδους για την μετατροπή τους σε επεξεργάσιμα δεδομένα για τον έλεγχο αντια-νταγωνιστικών πρακτικών.
Στο πρώτο στάδιο της διαχείρισης/συνδυασμού δεδομένων έγινε προσπάθεια ανάκτησης συμβάσεων βάσει σχετικών λέξεων κλειδιά (π.χ. «ΜΑΣΚΕΣ», «ΓΑΝΤΙΑ», «FFP3»). Στη συνέχεια τα μεταδεδομένα καταγραφής των συμβάσεων αυτών μαζί με τα αρχεία τους, συλλέχθηκαν σε τοπικές βάσεις για να αναλυθούν περαιτέρω. Τα αρχεία που συλλέχθηκαν («αλγοριθμικές συμβάσεις») με τον τρόπο αυτό είναι επεξεργάσιμα ημι-δομημένα αρχεία PDF, δηλαδή αρχεία που περιέχουν πληροφορίες χωρίς ταυτόσημη δομή, ήτοι όχι πλήρως μορφοποιημένα δεδομένα, έτοιμα για επεξεργασία. Σημειώνεται ότι στην πρώτη φάση της έρευνας δημιουργήθηκε μια μαζική/μεγάλη βάση δεδομένων (big data) επί της οποίας εφαρμόστηκαν αλγόριθμοι για να μπορεί να είναι διαχειρίσιμη για την εξαγωγή των σχετικών με την έρευνα στοιχείων.
Σε δεύτερο χρόνο, στο στάδιο του pre-processing, τα αποτελέσματα μελετήθηκαν και φιλτραρίστηκαν, μεριμνώντας για την αποφυγή τυχόν μεροληπτικών (biased) αποτελεσμάτων. Η διαδικασία αυτή που ουσιαστικά αποτελεί μέρος του feature engineering, έχει ως στόχο τη διαστατική ομαλοποίηση των αποτελεσμάτων αλλά και τη διαδοχική βελτίωση και επικαιροποίηση των παραμέτρων των ερωτημάτων/εντολών (queries) του API. Με τη δοκιμή και προσαρμογή των εντολών (queries), επετεύχθη η στοχευμένη ανάκτηση των σχετικότερων με την έρευνα συμβάσεων. Προχωρώντας στην ανάλυση των αποτελεσμάτων, έγινε μια επαναληπτική διαδικασία καθαρισμού και δειγματοληψίας (cleansing and re-sampling) για τη διασταύρωση/αντιστοίχιση των αποτελεσμάτων, καταλήγοντας τελικά σε ένα δείγμα 2.584 συμβάσεων από αρχικό σύνολο 150.000 συμβάσεων.
Τέλος, στο τρίτο στάδιο, ο αλγόριθμος εμπλουτίστηκε με στόχο την εξαγωγή τιμών από τα ημι-δομημένα δεδομένα. Συγκεκριμένα, χρησιμοποιήθηκαν τα πακέτα Camelot και Tabula από βιβλιοθήκες της Python, ώστε να γίνει αυτόματη εξαγωγή τιμών σε πίνακες για τα προϊόντα και των 2.584 συμβάσεων. Η διαδικασία ήταν επιτυχής για 692 συμβάσεις (27% του δείγματος). Ωστόσο, από αυτές μόνο 109 συμβάσεις είχαν τιμές ανά προϊόν και άρα μπορούσαν να χρησιμοποιηθούν για περαιτέρω ανάλυση.
Επίσης, τέθηκαν οι βάσεις για τα επόμενα βήματα: μελέτη, σχεδιασμό και «εκπαίδευση» ενός αυτοδίδακτου αλγορίθμου, ο οποίος δεν απαιτεί την ανθρώπινη μεσολάβηση για την επανάληψη των παραπάνω βημάτων, χρησιμοποιώντας Natural Language Processing και τεχνολογίες νοημοσύνης των μηχανών (machine learning). Στόχος είναι να δημιουργηθεί ένα περιβάλλον με τον αλγόριθμο να ανιχνεύει αυτόματα αποκλίσεις τιμολόγησης, οι οποίες θα αποτελέσουν τη βάση για περαιτέρω έρευνα στο πλαίσιο των αρμοδιοτήτων της Αρχής.
Το τελικό σύνολο των δεδομένων που αναλύθηκαν περιλαμβάνουν 917 παρατηρήσεις: 808 προερχόμενες από τη συλλογή πληροφοριών από τις Υγειονομικές Περιφέρειες και 109 από την πλατφόρμα ΔΙΑΥΓΕΙΑ. Στόχος της ανάλυσης είναι ο εντοπισμός ασυνήθιστα υψηλών τιμών για τα ερευνώμενα προϊόντα. Η ανάλυση επικεντρώθηκε μόνο στις τιμές, καθόσον σε αυτές τις ομάδες προϊόντων υπάρχει μια σχετική μεταβλητότητα στην ποιότητα. Αρχικά εξετάζεται η τιμή των προϊόντων σε ένα μοντέλο δύο μεταβλητών (bivariate set-up) κατά την περίοδο πριν και κατά την διάρκεια της κρίσης. Στη συνέχεια εξετάζονται οι τιμές μέσω ενός πολυμεταβλητού μοντέλου (multivariate set-up) που στην εκτίμησή του λαμβάνει υπ’ όψη του και άλλες μεταβλητές, όπως την περιοχή, τον αγοραστή, τον τύπο διαγωνιστικής διαδικασίας και την ποσότητα αγοράς[1]
Η σύγκριση των μέσων τιμών και των διακυμάνσεων πριν και κατά την περίοδο COVID-19 σε κάθε κατηγορία προϊόντων, παρέχει μια εικόνα για τις γενικές μεταβολές των τιμών με την πάροδο του χρόνου. Δεν προκαλεί έκπληξη το γεγονός ότι, για τις περισσότερες από τις ερευνώμενες κατηγορίες προϊόντων με επαρκή αριθμό παρατηρήσεων, η διάμεση τιμή αυξήθηκε[2], ενώ στις περισσότερες περιπτώσεις αυξήθηκαν και οι διακυμάνσεις (Πίνακας 1).
Πίνακας 1: Περιγραφικά στατιστικά στοιχεία για τις τιμές ανά προϊόν πριν και κατά την περίοδο COVID-19[3]
Η αυξημένη διακύμανση γύρω από τις διάμεσες τιμές καταδεικνύεται επίσης από διαγράμματα πλαισίου “box plots” (Διαγράμματα 1-4), στα οποία οι τελείες αντιπροσωπεύουν τις παρατηρούμενες ακραίες τιμές.
Διαγράμματα 1-4: “Box Plots” τιμών ανά προϊόν πριν και κατά την περίοδο COVID-19[4]
Όπως έχει ήδη ειπωθεί, για τον προσδιορισμό των ακραίων τιμών ακολουθήθηκε ανάλυση δύο μεταβλητών και εξετάστηκαν αρχικά τα ακραία σημεία: τιμές πριν και κατά τη διάρκεια της κρίσης. Οι μέσες τιμές και οι τυπικές αποκλίσεις υπολογίστηκαν για κάθε προϊόν ξεχωριστά. Ως ακραίες τιμές χαρακτηρίστηκαν αυτές οι οποίες παρουσίασαν μεγαλύτερη από +2 τυπικές αποκλίσεις από τη μέση τιμή.[5]
Συνολικά, υπάρχουν 120 μοναδικοί προμηθευτές που εκπροσωπούνται στα δεδομένα. Με βάση τις ακραίες τιμές, 29 προμηθευτές πωλούσαν προϊόντα με μία (1) τυπική απόκλιση πάνω από τη μέση τιμή του δεδομένου προϊόντος, ενώ για 17 προμηθευτές, η τιμή ξεπέρασε τη μέση τιμή κατά 2 τυπικές αποκλίσεις. Δεδομένου ότι κάποιες ακραίες τιμές ενδέχεται να μην είναι προϊόν αντι-ανταγωνιστικών πρακτικών, αλλά να οφείλονται σε παράγοντες που δεν λαμβάνονται υπ’ όψη στην ανωτέρω ανάλυση, χρησιμοποιήθηκε και ένα πολύ-μεταβλητό μοντέλο με διάφορες εκτιμήσεις.
Ο προσδιορισμός των ακραίων τιμών με τη χρήση ενός πολυμεταβλητού μοντέλου βασίστηκε σε ανάλυση γραμμικής παλινδρόμησης με εξαρτημένη μεταβλητή τον λογάριθμο της τιμής, χρησιμοποιώντας ως ερμηνευτικές μεταβλητές, ψευδομεταβλητές για πριν και κατά τη διάρκεια της κρίσης, την κατηγορία προϊόντος, λογάριθμο της ποσότητας, την περιοχή, την αναθέτουσα αρχή και τη διαγωνιστική διαδικασία καθώς και αλληλεπιδράσεις μεταξύ μεταβλητών. Ενδεικτικά παρατίθενται κάποιες παλινδρομήσεις με σημαντική ερμηνευτική δύναμη.
Πίνακας 2: Interacted OLS[6] regression results
Για τον προσδιορισμό των ακραίων τιμών, επιλέχθηκε το μοντέλο με την υψηλότερη επεξηγηματική δύναμη. Εν προκειμένω, χρησιμοποιήθηκε το μοντέλο της δεύτερης στήλης με R2 = 81% και εξετάστηκε η κατανομή των καταλοίπων του.
Πίνακας 3: Descriptive Statistics for the Model’s Error Term
Για τον εντοπισμό των ακραίων τιμών, υπολογίστηκε ο μέσος όρος καταλοίπων για την περίοδο της κρίσης ανά προμηθευτή και αποτυπώθηκε η κατανομή τους. Χρησιμοποιώντας ως κατώφλι, έπειτα από διάφορους υπολογισμούς, την τιμή x = 0,8, θεωρήθηκαν ως ακραίες τιμές αυτές πάνω από το κατώφλι αυτό. Στο παρακάτω Διάγραμμα η διακεκομμένη γραμμή αποτυπώνει το κατώφλι, πάνω από το οποίο εντοπίστηκαν ακραίες τιμές πέντε προμηθευτών.
Διάγραμμα 5: Distribution of the Model’s Error Term Averaged by the Supplier
Σύμφωνα με τα αποτελέσματα οι τιμές που προσφέρονται από πέντε (5) προμηθευτές κατά την COVID-19 περίοδο μπορούν να θεωρηθούν ως δυνητικές ακραίες τιμές. Δύο (2) από αυτούς τους προμηθευτές προέκυψε ότι είχαν ακραίες τιμές και κατά την εφαρμογή του προαναφερόμενου μοντέλου δύο μεταβλητών.
Η Επιτροπή θα προχωρήσει σε περαιτέρω έρευνα για τη διαπίστωση τυχόν αντι-ανταγωνιστικών πρακτικών, με την επιβολή, εάν υπάρχουν παραβάσεις της νομοθεσίας για τον ανταγωνισμό, αυστηρότατων κυρώσεων. Η ανάπτυξη αλγόριθμων που επιτρέπουν την αυτοματοποιημένη ανάλυση Μεγάλων Δεδομένων (Big Data) που εξάγονται από τις βάσεις δεδομένων για τις δημόσιες συμβάσεις αποτελεί πρωταρχικό σκοπό και προτεραιότητα της διοίκησης της ΕΑ.
Επισημαίνεται ότι στην παρούσα συγκυρία που η χώρα δοκιμάζεται από την πανδημία του κορωνοϊού, η ΕΑ παρακολουθεί τις εξελίξεις και θα συνεχίσει να επεμβαίνει ως αρμόδια για τη διαπίστωση τυχόν παραβάσεων των διατάξεων του ν. 3959/2011 και των άρθρων 101 και 102 της Συνθήκης Λειτουργίας Ευρωπαϊκής Ένωσης (ΣΛΕΕ) περί «Προστασίας του ελεύθερου ανταγωνισμού», με γνώμονα τη διαφύλαξη της υγιούς ανταγωνιστικής δομής της αγοράς, της προστασίας των συμφερόντων του καταναλωτή και την οικονομική ανάπτυξη.
[1] Η ποσότητα αγοράς ενώ είναι κρίσιμη στον καθορισμό τιμών, συχνά λείπει, οπότε χρησιμοποιείται μόνο σε ένα υποσύνολο των αναλύσεων.
[2] Η μέση τιμή είναι πιο αξιόπιστη για συγκρίσεις, καθώς υπάρχουν πολλές εξαιρετικά υψηλές τιμές. Ωστόσο, οι μέσες τιμές ακολουθούν σε μεγάλο βαθμό το ίδιο μοτίβο με τις διάμεσες τιμές.
[3] Σημείωση: στον πίνακα περιλήφθηκαν μόνο προϊόντα με επαρκή αριθμό παρατηρήσεων (N => 5) και για τις δύο περιόδους.
[4] Σημειώνεται ότι στα εν λόγω διαγράμματα απεικονίζονται μόνο τα προϊόντα τα οποία παρουσιάζονται στον Πίνακα 1.
[5] Σε μια κανονική κατανομή, περίπου 68% των παρατηρήσεων είναι εντός μίας τυπικής απόκλισης από το μέσο και περίπου 95% των παρατηρήσεων είναι εντός δύο τυπικών αποκλίσεων από τον μέσο.
[6] Ο αριθμός των παρατηρήσεων μειώθηκε μετά την κατάργηση προϊόντων με λιγότερες από 10 παρατηρήσεις για την περίοδο πριν και μετά COVID-19.