Adding side stream changes to Maemian. Working to integrate full upstream libraries...
[maemian] / nokia-lintian / lib / Dep.pm
diff --git a/nokia-lintian/lib/Dep.pm b/nokia-lintian/lib/Dep.pm
new file mode 100644 (file)
index 0000000..ef3bd94
--- /dev/null
@@ -0,0 +1,624 @@
+# -*- perl -*-
+
+# This library handles operations on dependencies.
+# It provides a routine Dep::parse that converts a dependency line in
+# the dpkg control format to its own internal format.
+# All its other routines work on that internal format.
+
+# A dependency line is viewed as a predicate formula.  The comma
+# separator means "and", and the alternatives separator means "or".
+# A bare package name is the predicate "a package of this name is
+# available".  A package name with a version clause is the predicate
+# "a package of this name that satisfies this version clause is
+# available".
+#
+# This way, the presence of a package can be represented simply as
+# "packagename (=version)", or if it has a Provides line, as
+# "packagename (=version) | provide1 | provide2 | provide3".
+
+use strict;
+
+use lib "$ENV{'LINTIAN_ROOT'}/lib";
+use Pipeline;
+
+package Dep;
+
+# ---------------------------------
+# public routines
+
+# We permit substvars for package names so that we can use the routines in
+# this library against the unparsed debian/control file.
+sub Pred {
+    $_[0] =~ 
+           /^\s*                           # skip leading whitespace
+             (                             # package name or substvar
+               [a-zA-Z0-9][a-zA-Z0-9+.-]+   #   package name
+               |                            #   or
+               (?:\$\{[a-zA-Z0-9:-]+\})     #   substvar
+              )                             # end of package name or substvar
+             (?:                           # start of optional part
+               \s* \(                      # open parenthesis for version part
+                \s* (<<|<=|=|>=|>>|<|>)     # relation part
+                \s* (.*?)                   # do not attempt to parse version
+                \s* \)                      # closing parenthesis
+             )?                            # end of optional part
+              (?:                           # start of optional architecture
+                \s* \[                      # open bracket for architecture
+                \s* (.*?)                   # don't parse architectures now
+                \s* \]                      # closing bracket
+              )?                            # end of optional architecture
+           /x;
+    return ['PRED', $1, undef, undef, $4] if not defined $2;
+    my $two = $2;
+    if ($two eq '<') {
+       $two = '<<';
+    } elsif ($two eq '>') {
+       $two = '>>';
+    }
+    return ['PRED', $1, $two, $3, $4];
+}
+
+sub Or { return ['OR', @_]; }
+sub And { return ['AND', @_]; }
+sub Not { return ['NOT', $_[0]]; }
+
+# Convert a dependency line into the internal format.
+# Non-local callers may store the results of this routine.
+sub parse {
+    my @deps;
+    for (split(/\s*,\s*/, $_[0])) {
+       next if /^$/;
+       my @alts;
+       if (/^perl\s+\|\s+perl5$/ or /^perl5\s+\|\s+perl\s+/) {
+           $_ = 'perl5';
+       }
+       for (split(/\s*\|\s*/, $_)) {
+           push(@alts, Dep::Pred($_));
+       }
+       if (@alts == 1) {
+           push(@deps, $alts[0]);
+       } else {
+           push(@deps, ['OR', @alts]);
+       }
+    }
+    return $deps[0] if @deps == 1;
+    return ['AND', @deps];
+}
+
+# Take the internal format and convert it back to text.  Note that what this
+# generates for NOT isn't valid Debian dependency syntax.
+sub unparse {
+    my ($p) = @_;
+    if ($p->[0] eq 'PRED') {
+       my $text = $p->[1];
+       if (defined $p->[2]) {
+           $text .= " ($p->[2] $p->[3])";
+       }
+       if (defined $p->[4]) {
+           $text .= " [$p->[4]]";
+       }
+       return $text;
+    } elsif ($p->[0] eq 'AND' || $p->[0] eq 'OR') {
+       my $sep = ($p->[0] eq 'AND') ? ', ' : ' | ';
+       my $text = '';
+       my $i = 1;
+       while ($i < @$p) {
+           $text .= $sep if $text;
+           $text .= unparse($p->[$i++]);
+       }
+       return $text;
+    } elsif ($p->[0] eq 'NOT') {
+       return '! ' . unparse($p->[1]);
+    }
+    return undef;
+}
+
+# ---------------------------------
+
+# Takes two predicate formulas and returns true iff the second can be
+# deduced from the first.
+sub implies {
+    my ($p, $q) = @_;
+    my $i;
+
+    #Dep::debugprint($p);
+    #warn " |- ";
+    #Dep::debugprint($q);
+    #warn "\n";
+    #use Data::Dumper;
+
+    if ($q->[0] eq 'PRED') {
+       if ($p->[0] eq 'PRED') {
+               return Dep::pred_implies($p, $q);
+       } elsif ($p->[0] eq 'AND') {
+           $i = 1;
+           while ($i < @$p) {
+               return 1 if Dep::implies($p->[$i++], $q);
+           }
+           return 0;
+       } elsif ($p->[0] eq 'OR') {
+           $i = 1;
+           while ($i < @$p) {
+               return 0 if not Dep::implies($p->[$i++], $q);
+           }
+           return 1;
+       } elsif ($p->[0] eq 'NOT') {
+           return Dep::implies_inverse($p->[1], $q);
+       }
+    } elsif ($q->[0] eq 'AND') {
+       # Each of q's clauses must be deduced from p.
+       $i = 1;
+       while ($i < @$q) {
+           return 0 if not Dep::implies($p, $q->[$i++]);
+       }
+       return 1;
+    } elsif ($q->[0] eq 'OR') {
+       # If p is something other than OR, p needs to satisfy one of the
+       # clauses of q.  If p is an AND clause, q is satisfied if any of the
+       # clauses of p satisfy it.
+       #
+       # The interesting case is OR.  In this case, do an OR to OR comparison
+       # to determine if q's clause is a superset of p's clause as follows:
+       # take each branch of p and see if it satisfies a branch of q.  If
+       # each branch of p satisfies some branch of q, return 1.  Otherwise,
+       # return 0.
+       #
+       # Simple logic that requires that p satisfy at least one of the
+       # clauses of q considered in isolation will miss that a|b satisfies
+       # a|b|c, since a|b doesn't satisfy any of a, b, or c in isolation.
+       if ($p->[0] eq 'PRED') {
+           $i = 1;
+           while ($i < @$q) {
+               return 1 if Dep::implies($p, $q->[$i++]);
+           }
+           return 0;
+       } elsif ($p->[0] eq 'AND') {
+           $i = 1;
+           while ($i < @$p) {
+               return 1 if Dep::implies($p->[$i++], $q);
+           }
+           return 0;
+       } elsif ($p->[0] eq 'OR') {
+           for ($i = 1; $i < @$p; $i++) {
+               my $j = 1;
+               my $satisfies = 0;
+               while ($j < @$q) {
+                   if (Dep::implies($p->[$i], $q->[$j++])) {
+                       $satisfies = 1;
+                       last;
+                   }
+               }
+               return 0 unless $satisfies;
+           }
+           return 1;
+       } elsif ($p->[0] eq 'NOT') {
+           return Dep::implies_inverse($p->[1], $q);
+       }
+    } elsif ($q->[0] eq 'NOT') {
+       if ($p->[0] eq 'NOT') {
+           return Dep::implies($q->[1], $p->[1]);
+       }
+       return Dep::implies_inverse($p, $q->[1]);
+    }
+}
+
+# Takes two predicate formulas and returns true iff the falsehood of the
+# second can be deduced from the truth of the first.
+sub implies_inverse {
+    my ($p, $q) = @_;
+    my $i;
+
+#    Dep::debugprint($p);
+#    warn " |- !";
+#    Dep::debugprint($q);
+#    warn "\n";
+
+    if ($$q[0] eq 'PRED') {
+       if ($$p[0] eq 'PRED') {
+           return Dep::pred_implies_inverse($p, $q);
+       } elsif ($$p[0] eq 'AND') {
+           # q's falsehood can be deduced from any of p's clauses
+           $i = 1;
+           while ($i < @$p) {
+               return 1 if Dep::implies_inverse($$p[$i++], $q);
+           }
+           return 0;
+       } elsif ($$p[0] eq 'OR') {
+           # q's falsehood must be deduced from each of p's clauses
+           $i = 1;
+           while ($i < @$p) {
+               return 0 if not Dep::implies_inverse($$p[$i++], $q);
+           }
+           return 1;
+       } elsif ($$p[0] eq 'NOT') {
+           return Dep::implies($q, $$p[1]);
+       }
+    } elsif ($$q[0] eq 'AND') {
+       # Any of q's clauses must be falsified by p.
+       $i = 1;
+       while ($i < @$q) {
+           return 1 if Dep::implies_inverse($p, $$q[$i++]);
+       }
+       return 0;
+    } elsif ($$q[0] eq 'OR') {
+       # Each of q's clauses must be falsified by p.
+       $i = 1;
+       while ($i < @$q) {
+           return 0 if not Dep::implies_inverse($p, $$q[$i++]);
+       }
+       return 1;
+    } elsif ($$q[0] eq 'NOT') {
+       return Dep::implies($p, $$q[1]);
+    }
+}
+
+# Takes two predicates and returns true iff the second can be deduced from the
+# first.  If the second is falsified by the first (in other words, if p
+# actually implies not q), return 0.  Otherwise, return undef.  The 0 return
+# is used by pred_implies_inverse.
+sub pred_implies {
+    my ($p, $q) = @_;
+    # If the names don't match, there is no relationship between them.
+    $$p[1] ||= ''; $$q[1] ||= '';
+    return undef if $$p[1] ne $$q[1];
+
+    # If the names match, then the only difference is in the architecture or
+    # version clauses.  First, check architecture.  The architectures for p
+    # must be a superset of the architectures for q.
+    my @p_arches = split(' ', $$p[4] || '');
+    my @q_arches = split(' ', $$q[4] || '');
+    if (@p_arches || @q_arches) {
+        my $p_arch_neg = @p_arches && $p_arches[0] =~ /^!/;
+        my $q_arch_neg = @q_arches && $q_arches[0] =~ /^!/;
+
+        # If p has no arches, it is a superset of q and we should fall through
+        # to the version check.
+        if (not @p_arches) {
+            # nothing
+        }
+
+        # If q has no arches, it is a superset of p and there are no useful
+        # implications.
+        elsif (not @q_arches) {
+            return undef;
+        }
+
+        # Both have arches.  If neither are negated, we know nothing useful
+        # unless q is a subset of p.
+        elsif (not $p_arch_neg and not $q_arch_neg) {
+            my %p_arches = map { $_ => 1 } @p_arches;
+            my $subset = 1;
+            for my $arch (@q_arches) {
+                $subset = 0 unless $p_arches{$arch};
+            }
+            return undef unless $subset;
+        }
+
+        # If both are negated, we know nothing useful unless p is a subset of
+        # q (and therefore has fewer things excluded, and therefore is more
+        # general).
+        elsif ($p_arch_neg and $q_arch_neg) {
+            my %q_arches = map { $_ => 1 } @q_arches;
+            my $subset = 1;
+            for my $arch (@p_arches) {
+                $subset = 0 unless $q_arches{$arch};
+            }
+            return undef unless $subset;
+        }
+
+        # If q is negated and p isn't, we'd need to know the full list of
+        # arches to know if there's any relationship, so bail.
+        elsif (not $p_arch_neg and $q_arch_neg) {
+            return undef;
+        }
+
+        # If p is negated and q isn't, q is a subset of p iff none of the
+        # negated arches in p are present in q.
+        elsif ($p_arch_neg and not $q_arch_neg) {
+            my %q_arches = map { $_ => 1 } @q_arches;
+            my $subset = 1;
+            for my $arch (@p_arches) {
+                $subset = 0 if $q_arches{substr($arch, 1)};
+            }
+            return undef unless $subset;
+        }
+    }
+
+    # Now, down to version.  The implication is true if p's clause is stronger
+    # than q's, or is equivalent.
+
+    # If q has no version clause, then p's clause is always stronger.
+    return 1 if not defined $$q[2];
+
+    # If q does have a version clause, then p must also have one.
+    return undef if not defined $$p[2];
+
+    # q wants an exact version, so p must provide that exact version.  p
+    # disproves q if q's version is outside the range enforced by p.
+    if ($$q[2] eq '=') {
+       if ($$p[2] eq '<<') {
+           return Dep::versions_lte($$p[3], $$q[3]) ? 0 : undef;
+       } elsif ($$p[2] eq '<=') {
+           return Dep::versions_lt($$p[3], $$q[3]) ? 0 : undef;
+       } elsif ($$p[2] eq '>>') {
+           return Dep::versions_gte($$p[3], $$q[3]) ? 0 : undef;
+       } elsif ($$p[2] eq '>=') {
+           return Dep::versions_gt($$p[3], $$q[3]) ? 0 : undef;
+       } elsif ($$p[2] eq '=') {
+           return Dep::versions_equal($$p[3], $$q[3]);
+       }
+    }
+
+    # A greater than clause may disprove a less than clause.  Otherwise, if
+    # p's clause is <<, <=, or =, the version must be <= q's to imply q.
+    if ($$q[2] eq '<=') {
+       if ($$p[2] eq '>>') {
+           return Dep::versions_gte($$p[3], $$q[3]) ? 0 : undef;
+       } elsif ($$p[2] eq '>=') {
+           return Dep::versions_gt($$p[3], $$q[3]) ? 0 : undef;
+       } elsif ($$p[2] eq '=') {
+           return Dep::versions_lte($$p[3], $$q[3]);
+       } else {
+           return Dep::versions_lte($$p[3], $$q[3]) ? 1 : undef;
+       }
+    }
+
+    # Similar, but << is stronger than <= so p's version must be << q's
+    # version if the p relation is <= or =.
+    if ($$q[2] eq '<<') {
+       if ($$p[2] eq '>>' or $$p[2] eq '>=') {
+           return Dep::versions_gte($$p[3], $$p[3]) ? 0 : undef;
+       } elsif ($$p[2] eq '<<') {
+           return Dep::versions_lte($$p[3], $$q[3]);
+       } elsif ($$p[2] eq '=') {
+           return Dep::versions_lt($$p[3], $$q[3]);
+       } else {
+           return Dep::versions_lt($$p[3], $$q[3]) ? 1 : undef;
+       }
+    }
+
+    # Same logic as above, only inverted.
+    if ($$q[2] eq '>=') {
+       if ($$p[2] eq '<<') {
+           return Dep::versions_lte($$p[3], $$q[3]) ? 0 : undef;
+       } elsif ($$p[2] eq '<=') {
+           return Dep::versions_lt($$p[3], $$q[3]) ? 0 : undef;
+       } elsif ($$p[2] eq '=') {
+           return Dep::versions_gte($$p[3], $$q[3]);
+       } else {
+           return Dep::versions_gte($$p[3], $$q[3]) ? 1 : undef;
+       }
+    }
+    if ($$q[2] eq '>>') {
+       if ($$p[2] eq '<<' or $$p[2] eq '<=') {
+           return Dep::versions_lte($$p[3], $$q[3]) ? 0 : undef;
+       } elsif ($$p[2] eq '>>') {
+           return Dep::versions_gte($$p[3], $$q[3]);
+       } elsif ($$p[2] eq '=') {
+           return Dep::versions_gt($$p[3], $$q[3]);
+       } else {
+           return Dep::versions_gt($$p[3], $$q[3]) ? 1 : undef;
+       }
+    }
+
+    return undef;
+}
+
+# Takes two predicates and returns true iff the falsehood of the second can be
+# deduced from the truth of the first.  In other words, p implies not q, or
+# resstated, q implies not p.  (Since if a implies b, not b implies not a.)
+sub pred_implies_inverse {
+    my ($p, $q) = @_;
+    my $res = Dep::pred_implies($q, $p);
+
+    return not $res if defined $res;
+    return undef;
+}
+
+# ---------------------------------
+# version routines
+
+my %cached;
+
+sub versions_equal {
+    my ($p, $q) = @_;
+    my $res;
+
+    return 1 if $p eq $q;
+    return 1 if $Dep::cached{"$p == $q"};
+    return 1 if $Dep::cached{"$p <= $q"} and $Dep::cached{"$p >= $q"};
+    return 0 if $Dep::cached{"$p != $q"};
+    return 0 if $Dep::cached{"$p << $q"};
+    return 0 if $Dep::cached{"$p >> $q"};
+
+    $res = Dep::get_version_cmp($p, 'eq', $q);
+
+    if ($res) {
+       $Dep::cached{"$p == $q"} = 1;
+    } else {
+       $Dep::cached{"$p != $q"} = 1;
+    }
+
+    return $res;
+}
+
+sub versions_lte {
+    my ($p, $q) = @_;
+    my $res;
+
+    return 1 if $p eq $q;
+    return 1 if $Dep::cached{"$p <= $q"};
+    return 1 if $Dep::cached{"$p == $q"};
+    return 1 if $Dep::cached{"$p << $q"};
+    return 0 if $Dep::cached{"$p >> $q"};
+    return 0 if $Dep::cached{"$p >= $q"} and $Dep::cached{"$p != $q"};
+
+    $res = Dep::get_version_cmp($p, 'le', $q);
+
+    if ($res) {
+       $Dep::cached{"$p <= $q"} = 1;
+    } else {
+       $Dep::cached{"$p >> $q"} = 1;
+    }
+
+    return $res;
+}
+
+sub versions_gte {
+    my ($p, $q) = @_;
+    my $res;
+
+    return 1 if $p eq $q;
+    return 1 if $Dep::cached{"$p >= $q"};
+    return 1 if $Dep::cached{"$p == $q"};
+    return 1 if $Dep::cached{"$p >> $q"};
+    return 0 if $Dep::cached{"$p << $q"};
+    return 0 if $Dep::cached{"$p <= $q"} and $Dep::cached{"$p != $q"};
+
+    $res = Dep::get_version_cmp($p, 'ge', $q);
+
+    if ($res) {
+       $Dep::cached{"$p >= $q"} = 1;
+    } else {
+       $Dep::cached{"$p << $q"} = 1;
+    }
+
+    return $res;
+}
+
+sub versions_lt {
+    my ($p, $q) = @_;
+    my $res;
+
+    return 0 if $p eq $q;
+    return 1 if $Dep::cached{"$p << $q"};
+    return 0 if $Dep::cached{"$p == $q"};
+    return 0 if $Dep::cached{"$p >= $q"};
+    return 0 if $Dep::cached{"$p >> $q"};
+    return 1 if $Dep::cached{"$p <= $q"} and $Dep::cached{"$p != $q"};
+
+    $res = Dep::get_version_cmp($p, 'lt', $q);
+
+    if ($res) {
+       $Dep::cached{"$p << $q"} = 1;
+    } else {
+       $Dep::cached{"$p >= $q"} = 1;
+    }
+
+    return $res;
+}
+
+sub versions_gt {
+    my ($p, $q) = @_;
+    my $res;
+
+    return 0 if $p eq $q;
+    return 1 if $Dep::cached{"$p >> $q"};
+    return 0 if $Dep::cached{"$p == $q"};
+    return 0 if $Dep::cached{"$p <= $q"};
+    return 0 if $Dep::cached{"$p << $q"};
+    return 1 if $Dep::cached{"$p >= $q"} and $Dep::cached{"$p != $q"};
+
+    $res = Dep::get_version_cmp($p, 'gt', $q);
+
+    if ($res) {
+       $Dep::cached{"$p >> $q"} = 1;
+    } else {
+       $Dep::cached{"$p <= $q"} = 1;
+    }
+
+    return $res;
+}
+
+sub get_version_cmp {
+    return ::spawn('dpkg', '--compare-versions', @_) == 0;
+}
+
+# ---------------------------------
+
+# Return a list of duplicated relations.  Each member of the list will be an
+# anonymous array holding the set of relations that are considered duplicated.
+# Two relations are considered duplicates if one implies the other.
+sub get_dups {
+    my $p = shift;
+
+    if ($p->[0] ne 'AND') {
+       return ();
+    }
+
+    # The logic here is a bit complex in order to merge sets of duplicate
+    # dependencies.  We want foo (<< 2), foo (>> 1), foo (= 1.5) to end up as
+    # one set of dupliactes, even though the first doesn't imply the second.
+    #
+    # $dups holds a hash, where the key is the earliest dependency in a set
+    # and the value is a hash whose keys are the other dependencies in the
+    # set.  $seen holds a map from package names to the duplicate sets that
+    # they're part of, if they're not the earliest package in a set.  If
+    # either of the dependencies in a duplicate pair were already seen, add
+    # the missing one of the pair to the existing set rather than creating a
+    # new one.
+    my (%dups, %seen);
+    for (my $i = 1; $i < @$p; $i++) {
+       for (my $j = $i + 1; $j < @$p; $j++) {
+           if (Dep::implies($p->[$i], $p->[$j]) || Dep::implies($p->[$j], $p->[$i])) {
+               my $first = unparse($p->[$i]);
+               my $second = unparse($p->[$j]);
+               if ($seen{$first}) {
+                   $dups{$seen{$first}}->{$second} = $j;
+                   $seen{$second} = $seen{$first};
+               } elsif ($seen{$second}) {
+                   $dups{$seen{$second}}->{$first} = $i;
+                   $seen{$first} = $seen{$second};
+               } else {
+                   $dups{$first} ||= {};
+                   $dups{$first}->{$second} = $j;
+                   $seen{$second} = $first;
+               }
+           }
+       }
+    }
+
+    # The sort maintains the original order in which we encountered the
+    # dependencies, just in case that helps the user find the problems,
+    # despite the fact we're using a hash.
+    return map {
+        [ $_,
+          sort {
+              $dups{$_}->{$a} <=> $dups{$_}->{$b}
+          } keys %{ $dups{$_} }
+        ]
+    } keys %dups;
+}
+
+# ---------------------------------
+
+sub debugprint {
+    my $x;
+    my $i;
+
+    for $x (@_) {
+       if ($$x[0] eq 'PRED') {
+           if (@$x == 2) {
+               warn "PRED($$x[1])";
+           } else {
+               warn "PRED($$x[1] $$x[2] $$x[3])";
+           }
+       } else {
+           warn "$$x[0](";
+           $i = 1;
+           while ($i < @$x) {
+               Dep::debugprint($$x[$i++]);
+               warn ", " if ($i < @$x);
+           }
+           warn ")";
+       }
+     }
+}
+
+1;
+
+# Local Variables:
+# indent-tabs-mode: t
+# cperl-indent-level: 4
+# End:
+# vim: syntax=perl sw=4 ts=8